网易首页 > 网易号 > 正文 申请入驻

Veo何止生成视频:DeepMind正在用它模拟整个机器人世界

0
分享至


机器之心报道

机器之心编辑部

随着通用型(Generalist)机器人策略的发展,机器人能够通过自然语言指令在多种环境中完成各类任务,但这也带来了显著的挑战。

一方面,真实世界评估成本极高,需要系统性地覆盖常规场景、极端情况、分布外(OOD)环境以及各类安全风险,通常需要进行成百上千次真实硬件实验,不仅耗时、昂贵,还可能存在操作风险。

另一方面,安全性评估尤为棘手,许多潜在的不安全行为(例如误夹人手、损坏设备或引发环境危险)本身就不适合在真实环境中反复测试,使得传统的硬件评估方法在安全场景下往往难以实施。

传统的物理仿真器虽然有帮助,但在真实感、多样性、搭建成本和视觉一致性方面仍存在明显瓶颈。

另外,前沿视频模型为世界仿真提供了一种替代路径,有望解决前文提到的诸多挑战。然而,要真正发挥这一潜力面临很多困难,主要原因包括:

1)在闭环、动作条件生成中容易产生伪影;

2)对接触动力学(如物体接触、碰撞)的仿真十分困难;

3)现代策略架构对多视角一致性提出了较高要求,而这在视频生成中并不容易满足。



  • 论文地址:https://arxiv.org/pdf/2512.10675
  • 项目主页:https://veo-robotics.github.io/
  • 论文标题:Evaluating Gemini Robotics Policies in a Veo World Simulator

本文,来自 Google DeepMind Gemini Robotics 团队研究者提出了一种基于视频建模的机器人策略评估系统,能够支持机器人领域中完整范围的策略评估需求,包括分布内评估、分布外泛化评估,以及红队测试。



具体而言,该系统基于最先进的视频生成模型 Veo,实现了带动作条件约束、具备多视角一致性的视频仿真,不仅在视觉上高度真实,还能够对机器人细粒度控制做出合理响应。同时,该系统集成了生成式编辑技术,使得无需搭建真实物理场景,就能生成包含新物体、新视觉背景以及安全关键元素的多样化、逼真的真实世界场景变体。

通过 1600 余次真实世界实验,并在八个通用型策略检查点和五项任务上验证了视频模型预测结果的有效性。实验结果表明,该系统在保持底层视频基础模型原有能力的同时,达到了进行严格机器人评估所需的高保真度。

尽管视频建模在机器人领域仍处于早期阶段,但本文清晰地展示了一条利用视频仿真世界,实现机器人策略泛化能力与安全性可扩展评估的可行路径。



视频链接:https://mp.weixin.qq.com/s/qiRQSruwI2ESfQxHsceUpw

方法介绍

在模型架构方面,本文采用 Veo 2 作为基础模型。

在数据方面,模型在一个包含大量视频、图像及其对应标注的数据集上进行训练。这些文本描述由 Gemini 模型自动生成,并且所有数据都经过了严格的预处理与整理。

此外,本文在一个大规模机器人数据集上对预训练的 Veo2 模型进行了微调。该数据集包含多种任务,覆盖了在大量不同场景中所需的广泛操作技能。图 2(上)展示了一个示例,将渲染后的机器人位姿叠加在生成的视频帧之上的效果。



最后,为减轻部分观测带来的影响,本文将系统中的四个相机视角(包括俯视视角、侧视视角,以及左右腕部视角)拼接成一个整体输入。然后对 Veo2 进行微调,使其能够在给定初始帧和未来机器人位姿的条件下,生成这种拼接后的多视角未来帧。图 2(下)展示了一个由该模型生成的多视角视频帧示例。



实验

本文通过 1600 余次真实世界评估,在八个通用型策略检查点和五项任务上进行了实验。

在基于 Gemini Robotics On-Device(GROD)模型训练了端到端的 VLA 策略。随后,使用经过微调的 Veo(Robotics)视频模型,在分布内场景中对这些策略进行评估。

指令:把右上角的红色葡萄放入灰色盒子的左上角隔间。



指令:把乐高积木放进乐高积木袋里。

指令:把棕色的长条物放进午餐包的顶部口袋里。

研究中,作者还使用 Veo(Robotics)模型,对 8 个不同版本的 VLA 机器人策略进行性能预测,然后把这些预测结果与机器人在真实世界中的实际测试结果进行对比,以检验视频模型预测是否准确、可靠。如下 demo 展示了 Veo(Robotics)针对两种策略的实际运行示例。



下图比较了视频模拟预测结果与实际成功率。可以观察到,Veo(Robotics)能够根据性能对不同的策略进行排名。本文还发现预测成功率与实际成功率之间存在很强的相关性。



接下来作者测试了模型分布外泛化能力。通过改造真实场景来制造新情况,用视频模型提前预测机器人在陌生环境中的表现,并用真实实验验证这些预测是否靠谱。



最后,本文证明了 Veo(Robotics)世界模型可以用来做安全红队测试。也就是说,不需要先让机器人在真实世界中冒险,就可以在视频模拟的世界里主动寻找策略可能出现的不安全行为。

例如合上电脑:



快速抓取红色积木:



了解更多内容,请参考原论文。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
以2.5吨白银建造的湖南“永兴银楼”被拍卖,其中1.75吨纯银折算1204.7万元,每克仅6.88元“白菜价”,委托方回应

以2.5吨白银建造的湖南“永兴银楼”被拍卖,其中1.75吨纯银折算1204.7万元,每克仅6.88元“白菜价”,委托方回应

极目新闻
2026-02-01 16:43:12
中日韩最大财团对比:三星3.2万亿,三菱21万亿,中国第一是谁?

中日韩最大财团对比:三星3.2万亿,三菱21万亿,中国第一是谁?

阿器谈史
2026-01-30 08:40:58
福建南安致2死6伤电力施工爆炸事故调查报告发布

福建南安致2死6伤电力施工爆炸事故调查报告发布

界面新闻
2026-02-02 11:40:10
乌克兰战机2026年首次飞入俄罗斯领土!摧毁库尔斯克指挥部

乌克兰战机2026年首次飞入俄罗斯领土!摧毁库尔斯克指挥部

项鹏飞
2026-01-30 16:10:31
13岁女生确诊胃癌晚期,医生:她吸了13年爸爸的二手烟,肚子里布满了大大小小的肿瘤,没有任何治愈机会

13岁女生确诊胃癌晚期,医生:她吸了13年爸爸的二手烟,肚子里布满了大大小小的肿瘤,没有任何治愈机会

观威海
2026-01-31 10:06:12
湖北一对夫妻带双胞胎宝宝出门,驶上高速才发现后座少了一个娃,网友笑评:“毕竟刚生的,还不太熟”

湖北一对夫妻带双胞胎宝宝出门,驶上高速才发现后座少了一个娃,网友笑评:“毕竟刚生的,还不太熟”

扬子晚报
2026-02-02 12:09:31
莫迪也上了爱泼斯坦文件,情节有点尬…印方火速否认

莫迪也上了爱泼斯坦文件,情节有点尬…印方火速否认

观察者网
2026-02-01 20:37:25
TOP14位身高170以上的女神,有颜有灯有演技

TOP14位身高170以上的女神,有颜有灯有演技

素然追光
2026-01-02 02:45:02
对张庆鹏竖中指?沈梓捷情绪失控一路怒喷 北控或已失控

对张庆鹏竖中指?沈梓捷情绪失控一路怒喷 北控或已失控

大嘴爵爷侃球
2026-02-02 09:31:34
快船近21战17胜4负同时期联盟最佳!莱昂纳德连续27场20+分

快船近21战17胜4负同时期联盟最佳!莱昂纳德连续27场20+分

Emily说个球
2026-02-02 12:10:21
陈松伶自曝晚年将住养老院!遗产早被惦记,外甥女:所有都是我的

陈松伶自曝晚年将住养老院!遗产早被惦记,外甥女:所有都是我的

科学发掘
2026-02-01 01:25:59
32岁!生涯首次入选!快船交易的全明星后卫

32岁!生涯首次入选!快船交易的全明星后卫

篮球实战宝典
2026-02-02 13:50:07
金价暴跌后实探北京金店:有消费者拖行李箱“抄底”,回收变现需排队3个半小时

金价暴跌后实探北京金店:有消费者拖行李箱“抄底”,回收变现需排队3个半小时

红星新闻
2026-02-01 17:17:29
委内瑞拉首次出口液化石油气

委内瑞拉首次出口液化石油气

界面新闻
2026-02-02 07:49:02
金饰克价跌至1484元 单日再跌134元/克

金饰克价跌至1484元 单日再跌134元/克

财联社
2026-02-02 09:30:33
阳东巨变!渔民血亏转富豪?广东阳西眼红了!

阳东巨变!渔民血亏转富豪?广东阳西眼红了!

阿芒娱乐说
2026-02-01 18:41:51
捡漏二手物品简直太香了!网友分享一个比一个羡慕,冒青烟了

捡漏二手物品简直太香了!网友分享一个比一个羡慕,冒青烟了

夜深爱杂谈
2026-01-30 18:07:30
卡里克豪取3连胜!英超5战获13分,曼联队史首人,阿莫林下课不冤

卡里克豪取3连胜!英超5战获13分,曼联队史首人,阿莫林下课不冤

奥拜尔
2026-02-02 00:03:35
周杰伦带王俊凯陈奕迅聚餐:很开心带大家聚餐,可以聊聊音乐真好

周杰伦带王俊凯陈奕迅聚餐:很开心带大家聚餐,可以聊聊音乐真好

韩小娱
2026-02-02 10:04:30
85岁老人被指漏水到楼下,自砸地板证清白全程公证,结果:没渗漏;“冤枉”业主物业该担何责?律师说法

85岁老人被指漏水到楼下,自砸地板证清白全程公证,结果:没渗漏;“冤枉”业主物业该担何责?律师说法

大风新闻
2026-02-01 20:16:03
2026-02-02 14:40:49
机器之心Pro incentive-icons
机器之心Pro
专业的人工智能媒体
12233文章数 142562关注度
往期回顾 全部

科技要闻

阿里筑墙,腾讯寄生,字节偷家

头条要闻

外媒:伊朗正处于最弱时期 是推翻现有政权的最佳时机

头条要闻

外媒:伊朗正处于最弱时期 是推翻现有政权的最佳时机

体育要闻

澳网男单决赛,属于阿尔卡拉斯的加冕仪式

娱乐要闻

周杰伦带王俊凯陈奕迅聚餐 畅聊音乐

财经要闻

贵金属大跌 多个期货主力合约触及跌停

汽车要闻

雷克萨斯LC500将于今年底停产 "最美雷克萨斯"谢幕

态度原创

旅游
艺术
家居
健康
游戏

旅游要闻

希腊纳克索斯岛被评为2026年全球最佳旅游目的地

艺术要闻

马斯克花5万买的折叠屋,是预制住宅的未来吗?

家居要闻

现代几何彩拼 智焕童梦居

耳石症分类型,症状大不同

梦幻西游星逸哥神赋造出20技能超否雷鸟人,服战神豪逆袭超否兽诀

无障碍浏览 进入关怀版