网易首页 > 网易号 > 正文 申请入驻

一次性总结数十个具身模型(24-25年Q1):从训练数据、动作预测、RL应用到Robotics VLM、VLA等

0
分享至

前言

先说一下本文的来历

  1. 本文一开始是属于此文《GRAPE——RLAIF微调VLA模型:通过偏好对齐提升机器人策略的泛化能力》的前言内容之一( 该文发布于23年12月底 ) 当时的前言是 具身的论文解读过很多之后,便会发现整个今24年的具身模型/策略大概如下所示——目前全网独一份「( 建议按照 从下至上 的顺序看,且所有点我都做了详尽而细致的解读,点击下面表格中对应的文字即可阅读,我后续也会不断完善之...

  2. 但后来考虑到其重要性,加之那么大一张表格 看下来 阅读体验较差,故抽出取来独立成文且拆分之

有意思的是,其中的RDT、π0都通过聚合各大机器人数据集先做预训练,然后微调,且它两的参数规模也分别达到了1B、3B

大有类似大语言模型的发展路线,比如

  • 17-20年,以BERT、GPT为代表的预训练-微调模式 且从GPT3起,模型的参数规模越来越大,慢慢的不再需要针对下游特定任务做微调——一个模型搞定所有任务

  • 再之后,咱们经历了GPT3.5的RLHF微调

  • 及至到GPT4之后,模型在各方面的能力逼近人类甚至超越人类

你说,是不是有趣?

最后,我得强调的是,本文所梳理的内容,只是让你入门具身,远远不是具身智能的全部『也不是本博客内具身系列内容的全部 且越往后 本文占比越低,毕竟暂只更新到25年Q1』,故通过本文梳理出来的内容入门具身之后,如果继续前进,则可享受未来更远的旅程

顺带说一下,模型那么多,该从哪个模型开始呢
事实上,对于“想进入具身的高校或公司”,ACT可称之为第一套设备、程序,如果你想以最快的速度复现,我给你打包好了机械臂和相关的配件、4090工作站,和全部的代码(包含部署代码),拿到后 环境一布 插电即用

七月:训练ACT抓瓶子的全套硬件和全部代码(想做具身先这个)

软硬全套一体 都远低于十几万那种的ur臂,如需要,可私苏苏老师:julyedukefu008或七月在线其他老师。

第一部分 从训练数据来源、动作预测策略、模型训练方法

1.1 训练数据来源:视频、仿真、人工采集

在机器人领域,互联网数据、仿真数据、真实数据等这三类数据构成了主要的数据来源

  • 如果采用端到端模仿学习的方法,给定一张图像并直接输出机器人动作,这通常依赖于真实世界数据

  • 如果采用端到端的强化学习RL,因为需要一个可以反复交互的环境,则往往依赖于仿真数据

当然,也有先在RL仿真环境里训练一个base model,然后再在真实环境中通过模仿学习微调——这个搞法,我司七月具身项目组 便用到过

详见如下表格


1.2 动作预测策略:以ACT、Diffusion Policy、下个token自回归预测居多


1.3 RL仿真在机械臂、人形上的应用



第二部分 VLA训练方式:Robotics VLM和VLA中的动作预测

2.1 是否做预训练


2.2动作预测:微调VLM之Robotics VLM和VLA

2.1.1 要么专门的动作头,要么下一个token自回归预测动作,要么融合扩散头和自回归


2.1.2训练数据形式:是文本数据还是机器人数据

微调或预训练VLM而言,一个重要的问题便是训练数据的由来


2.3 直接提示VLM规划的更细,但过程中加约束

如此文《让VLM充当机器人大脑——不微调直接提示VLM做顶层任务规划:从SayCan、VoxPoser到ViLA、CoPa、ReKep》所述,有


第三部分 架构层面:是否端到端及借鉴大语言模型的发展之路

3.1 从VLM规划、到微调VLM得到VLA,再到大脑VLM 小脑VLA、VLA中的分层

3.1.1 两个模型 大小脑各干各的:VLM做规划、小脑做控制


3.1.2 大小脑整合成一个模型:微调VLM得到VLA


3.1.3 大小脑两个模型:大脑VLM 小脑VLA


3.1.4 大小脑整合成一个模型,但分层以各司其职:慢思考 快反应


3.2借鉴大语言模型的发展之路(含3D版的VLA)


更多可以查看此文《RoboVLM——通用机器人策略的VLA设计哲学:如何选择骨干网络、如何构建VLA架构、何时添加跨本体数据》

第四部分 通用人形VLA的发展之路:慢思考(以类似o1/R1加强推理)、快反应


本文暂只更新到25年Q1, 如需要复现ACT的软硬全套:自主抓零食/分拣(含硬件和代码) 可私苏苏老师:julyedukefu008或七月在线其他老师。

无论是以下哪种情况(当然,各自所需的费用不同,可能低于6.5万,可能高于6.5万,视具体情况而定),我司具身团队皆可服务:

1需要复现ACT抓零食/抓瓶子/分拣或其他任务的所有全套硬件(包含机械臂、相机、结构件等全部,至于4090工作站则可选)、全套可跑起来可直接推理的代码

2有自己的部分硬件(比如任意某一款机械臂),但缺其他配件+ 需要全套代码

3 只单纯需要全套硬件

4硬件都不缺,只需要全套代码

↓↓↓扫码了解更多↓↓↓

咨询可私苏苏老师vx:julyedukefu008或七月在线其他老师

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
A股:不必等明天周五开盘了,行情太不对劲,不出意外会这么走!

A股:不必等明天周五开盘了,行情太不对劲,不出意外会这么走!

财经大拿
2026-01-29 13:47:20
一级军士长王忠心简历,他享受什么待遇?退休后婉拒百万年薪

一级军士长王忠心简历,他享受什么待遇?退休后婉拒百万年薪

混沌录
2026-01-27 22:33:05
女子用剁椒鱼头试探“网恋男友”,仍被骗68万

女子用剁椒鱼头试探“网恋男友”,仍被骗68万

中国日报
2026-01-29 12:00:59
男子购买法拍车,过户时发现车额外重了40斤,找到备胎后懵了

男子购买法拍车,过户时发现车额外重了40斤,找到备胎后懵了

罪案洞察者
2025-07-25 10:16:00
结婚23年她的内衣都是丈夫洗,在丈夫入狱后,她为夫还债三千万

结婚23年她的内衣都是丈夫洗,在丈夫入狱后,她为夫还债三千万

琨玉秋霜
2026-01-27 14:10:08
你们发现了吗?父母有退休金的家庭,基本都是这5种结局!

你们发现了吗?父母有退休金的家庭,基本都是这5种结局!

匹夫来搞笑
2026-01-28 10:23:39
一通便,二抗炎,三润肺,四增免疫,冬天使劲吃,焖一锅太鲜了

一通便,二抗炎,三润肺,四增免疫,冬天使劲吃,焖一锅太鲜了

小茉莉美食记
2026-01-27 17:34:17
蒙古为何成为韩国老男人的圣地?带你去瞧瞧这个可悲的国家

蒙古为何成为韩国老男人的圣地?带你去瞧瞧这个可悲的国家

吕醿极限手工
2025-12-29 18:33:00
44歲薛凱琪生圖流出真實容貌曝光,越見精緻臉上一部位惹關注

44歲薛凱琪生圖流出真實容貌曝光,越見精緻臉上一部位惹關注

粤睇先生
2026-01-28 10:23:44
美国和伊朗联手演戏,骗了全世界,最大输家出现,并非以色列

美国和伊朗联手演戏,骗了全世界,最大输家出现,并非以色列

潋滟晴方DAY
2026-01-28 18:36:19
iOS 微信发布 8.0.69 测试版,这些功能进行调整

iOS 微信发布 8.0.69 测试版,这些功能进行调整

简科技
2026-01-29 20:00:30
天津小伙接29岁离婚表嫂同居后续:表嫂正脸照流出曝更多离婚内幕

天津小伙接29岁离婚表嫂同居后续:表嫂正脸照流出曝更多离婚内幕

削桐作琴
2026-01-28 18:17:22
大姨问存款我谎称5万,她带哥上门要4万8买车,我摊牌:我有80万

大姨问存款我谎称5万,她带哥上门要4万8买车,我摊牌:我有80万

晓艾故事汇
2026-01-21 16:06:57
“曝金晨肇事逃逸”冲上热搜,知情人士称金晨驾驶汽车发生交通事故后让助理顶包

“曝金晨肇事逃逸”冲上热搜,知情人士称金晨驾驶汽车发生交通事故后让助理顶包

8099999街头巷尾
2026-01-29 15:35:04
301医院重磅成果!一针干细胞激活坏死脑神经,偏瘫者3天恢复行走

301医院重磅成果!一针干细胞激活坏死脑神经,偏瘫者3天恢复行走

番茄健康
2026-01-29 16:49:12
布鲁克林分享爱妻惬意床照,妮可拉赤裸上身瘦脱相,原因令人称赞

布鲁克林分享爱妻惬意床照,妮可拉赤裸上身瘦脱相,原因令人称赞

夜深爱杂谈
2026-01-28 22:52:08
刷屏!腾讯阿里争相接入,AI助手Clawdbot火了

刷屏!腾讯阿里争相接入,AI助手Clawdbot火了

第一财经资讯
2026-01-29 08:14:16
南京博物院事件升级,退休员工再曝大瓜,信息量太大,果然不简单

南京博物院事件升级,退休员工再曝大瓜,信息量太大,果然不简单

法老不说教
2025-12-23 16:48:26
71年张宗逊突然调到济南军区,得知实情哽咽:毛主席果然记得我

71年张宗逊突然调到济南军区,得知实情哽咽:毛主席果然记得我

大运河时空
2026-01-06 06:00:03
32岁程序员猝死后续:公司邮件通报,将死因归为没体检,撇清责任

32岁程序员猝死后续:公司邮件通报,将死因归为没体检,撇清责任

王大嘴评说
2026-01-29 09:08:59
2026-01-29 20:47:00
七月在线
七月在线
AI与智能网联汽车职教平台
836文章数 37关注度
往期回顾 全部

科技要闻

周亚辉的AI新赌局:国内太卷 出海另起炉灶

头条要闻

关键时刻伊朗接收俄罗斯装备 中国代表就局势发出警告

头条要闻

关键时刻伊朗接收俄罗斯装备 中国代表就局势发出警告

体育要闻

詹姆斯哭了!骑士视频致敬41岁超巨

娱乐要闻

曝金晨涉嫌交通肇事逃逸 本人尚未回应

财经要闻

崔东树:中国汽车未来年销或达5000万辆

汽车要闻

车长超5米还带后轮转向 比亚迪海豹08/海狮08将亮相

态度原创

游戏
艺术
手机
公开课
军事航空

LCK春季赛:逆转战局,远古龙组再添一胜,BFX四局战胜DNS

艺术要闻

梵高全集(高清350张)震撼……

手机要闻

国补价1699元起!REDMI Turbo 5发布:天玑8500-Ultra+7560mAh大电池

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

中国代表:支持伊朗国家稳定 武力解决不了问题

无障碍浏览 进入关怀版