网易首页 > 网易号 > 正文 申请入驻

人人都能玩得起AI机器人!HuggingFace开源低成本解决方案

0
分享至

新智元报道

编辑:alan

【新智元导读】近日,HuggingFace开源了低成本AI机器人LeRobot,并指导大家从头开始构建AI控制的机器人,包括组装、配置到训练控制机器人的神经网络。

当前的AI机器人,已经可以上蹿下跳后空翻、再接闪电五连鞭,代替人类承担各种工作。

哪怕是当大号手办,咱也想整一个玩玩。

但无奈目前大多公司还在研发阶段,少数能量产的又有亿点小贵。

当然了,小编相信AI和机器人最终会走进千家万户。

而现在,我们可以玩到一个低成本的解决方案——LeRobot:

——不知诸位可还记得「炒菜大师」ALOHA?

而这个LeRobot,就是我们自己可以拥有的ALOHA,能够模仿人类完成一些简单的任务。

单个机械臂的成本在200美元左右,而后端的模型训练在自己的笔记本上就可以搞定。

官方开源了全部的硬件和软件,包括训练和控制程序、AI模型、SolidWorks文件等。

我们可以从零组装出机械臂,并发挥想象教会它一些事情。

LeRobot项目由前特斯拉工程师Remi Cadene(现在是HuggingFace的principal research scientist)所领导,并给出了一份详细的指南,

包括如何从头开始构建AI控制的机器人,——组装、配置,以及训练控制机器人的神经网络。

项目基于开源的Koch v1.1机器人套件(也可以是别的硬件或者虚拟平台),包含两个六电机的机械臂,可使用一个或多个摄像头作为视觉传感器。

项目地址:https://github.com/huggingface/lerobot

LeRobot还计划在未来开发更具性价比的Moss v1版本,定价仅为150美元。

连 的作者也表示“Amazing”:

对于AI机器人,专业人士认为它将成为这个时代的PC:

我一直在等待两个平台的转变: -相当于早期PC的AR/VR -相当于早期个人电脑的机器人

而大多数网友则更加直接:这是我过去十年来一直想要的机械手,必须得到它!

说到开源的力量,项目刚刚发布就有网友玩了起来:

因为他表示自己的视频没有加速,所以小编也没给他加速。

目前的HuggingFace上给出了四种模型,以及98个数据集,开发者还可以选择在训练过程中上传自己的数据集。

制作自己的AI Robot

LeRobot目前使用的机械臂来源于Alexander Koch在几个月前开源的项目:

下图是前辈的样子,总体的硬件差别不大,但为了方便大家复刻和使用,LeRobot做了一些改进。

Koch v1.1拿掉了之前硬件模型中一些干扰材料,让尺寸标准化,并为引导臂添加了一个平台,允许从动臂从地面拾取物体。

通过更换直流转换器,Koch v1.1无需使用烙铁进行组装,也无需手动调节电压转换器。

项目还添加了机械臂的SolidWorks模型、接线图以及装配视频。

材料清单

以引导臂(Leader Arm)为例,

下表是需要购买的部件,主要的开销在6个舵机上面,剩下的包括电机驱动板、固定装置、电源、杜邦线之类的。

而手臂结构的塑料片,则需要根据给出的文件通过3D打印获得。

实际上对于相关爱好者来说,这些零件基本都能凑出来,而且咱们国内买这些东西也要便宜得多。

另外,如果需要平替或者升级伺服电机的话,记得修改控制程序。

他这里给出的两种电机扭矩都不大,但精度和转速倒是都挺高,不知道替换后会有多大影响,感兴趣的小伙伴不妨一试。

配置和校准

首先安装Koch v1.1所需的依赖:

pip install -e ".[koch]"

然后按照接线图给驱动板和电机供电,USB连接到电脑:

注意从动臂这边有俩大一点的电机需要12V供电,以及USB不能作为电源。

通过以下命令进行电机的配置和校准:

python lerobot/scripts/control_robot.py teleoperate \ --robot-path lerobot/configs/robot/koch.yaml \ --robot-overrides '~cameras' # do not instantiate the cameras

程序实例化一个类来调用SDK操作电机(port改为自己设备上检测到的端口):

DynamixelMotorsBus(port="/dev/tty.usbmodem575E0031751")

接下来配置每个电机的索引(相当于在总线上控制时的地址):

follower_arm = DynamixelMotorsBus( port=follower_port, motors={ # name: (index, model)"shoulder_pan": (1, "xl430-w250"), "shoulder_lift": (2, "xl430-w250"), "elbow_flex": (3, "xl330-m288"), "wrist_flex": (4, "xl330-m288"), "wrist_roll": (5, "xl330-m288"), "gripper": (6, "xl330-m288"), }, )

DynamixelMotorsBus会自动检测当前电机索引,如果电机中保存的索引与配置文件中不匹配,会触发一个配置过程,需要拔掉电机的电源,按顺序重新连接电机。

读写测试

运行以下代码:

leader_pos = leader_arm.read("Present_Position") follower_pos = follower_arm.read("Present_Position") print(leader_pos) print(follower_pos)

配置成功后可以得到所有12个电机的当前位置:

array([2054, 523, 3071, 1831, 3049, 2441], dtype=int32) array([2003, 1601, 56, 2152, 3101, 2283], dtype=int32)

校准

手动调节机械臂到几个固定的位置,相当于给电机一个相对的归零位置,同时也保证引导臂和从动臂的静止位置大致对齐。

通过校准程序之后,这几个位置会被写入配置文件,作为之后运行的基准。

——温馨提示:记得不要在Torque_Enable的情况下硬掰。

开玩!

准备就绪,下面可以开始控制机械臂了,比如让从动臂模仿引导臂,设置采样频率200Hz,操作30秒:

import tqdm seconds = 30 frequency = 200 for _ in tqdm.tqdm(range(seconds*frequency)): leader_pos = robot.leader_arms["main"].read("Present_Position") robot.follower_arms["main"].write("Goal_Position", leader_pos)

——是不是很简单?

那么由此可知,训练机械臂模仿人类的原理就是,在从动臂模仿引导臂的同时,加上一个摄像头的实时画面,

在模仿(训练)的过程中,模型收集了手臂位置和对应的图像数据,之后(推理)就可以根据当前摄像头看到的画面来预测各个电机需要到达的角度。

小编翻了一下项目的代码,发现这个「模仿游戏」所用的AI模型居然就是ALOHA用的Action Chunking with Transformers (ACT)。

论文地址:https://arxiv.org/pdf/2304.13705

除了ACT,你也可以使用或者训练自己的模型,可以改成ALOHA那样的双臂模式,或者在虚拟环境中进行训练和验证。

加入摄像头

项目使用opencv2库来操作camera,以下代码同时配置了机械臂和摄像头:

robot = KochRobot( leader_arms={"main": leader_arm}, follower_arms={"main": follower_arm}, calibration_path=".cache/calibration/koch.pkl", cameras={ "laptop": OpenCVCamera(0, fps=30, width=640, height=480), "phone": OpenCVCamera(1, fps=30, width=640, height=480), }, ) robot.connect()

使用下面的代码尝试以60 fps录制视频30秒(busy_wait负责控制帧率):

import time from lerobot.scripts.control_robot import busy_wait record_time_s = 30 fps = 60 states = [] actions = [] for _ in range(record_time_s * fps): start_time = time.perf_counter() observation, action = robot.teleop_step(record_data=True) states.append(observation["observation.state"]) actions.append(action["action"]) dt_s = time.perf_counter() - start_time busy_wait(1 / fps - dt_s)

摄像头拍摄的图像帧会以线程的形式保存在磁盘上,并在录制结束时编码为视频。

也可以将视频流显示在窗口中,以方便验证。

还可以使用命令行参数设置数据记录流程,包括录制开始前、录制过程和录制结束后停留的时间。

可视化

python lerobot/scripts/visualize_dataset_html.py \ --root data \ --repo-id ${HF_USER}/koch_test

以上命令将启动一个本地Web服务器,如下所示:

建议

一旦您熟悉了数据记录,就可以创建更大的数据集进行训练。一个好的开始任务是在不同位置抓取一个物体并将其放入箱子中。

建议至少录制50集,每个地点10集。在整个录制过程中保持摄像机固定并保持一致的抓取行为。

实现可靠的抓取性能后,您可以开始在数据收集过程中引入更多变化,例如额外的抓取位置、不同的抓取技术以及改变相机位置。

避免过快地添加太多变化,因为这可能会影响您的结果。

参考资料:

https://x.com/RemiCadene

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
吴京懵了、张艺谋乐了,17天了《镖人》还能被《惊蛰无声》反超

吴京懵了、张艺谋乐了,17天了《镖人》还能被《惊蛰无声》反超

娱乐故事
2026-03-05 17:10:51
日本政府紧张研判:派自卫队去霍尔木兹海峡

日本政府紧张研判:派自卫队去霍尔木兹海峡

都市快报橙柿互动
2026-03-05 13:57:55
物理学停滞100年,三座大山难以逾越!或许永远都无法进步?

物理学停滞100年,三座大山难以逾越!或许永远都无法进步?

心中的麦田
2026-03-03 20:19:10
全线下跌!黄金、白银直线跳水!美股突变!美军,被曝大消息!

全线下跌!黄金、白银直线跳水!美股突变!美军,被曝大消息!

证券时报e公司
2026-03-05 23:12:55
民用北斗被干扰了?中国船员称所有系统全都失效,只能用传统手段

民用北斗被干扰了?中国船员称所有系统全都失效,只能用传统手段

南权先生
2026-03-05 15:22:09
伊朗:禁止美以欧船只通过霍尔木兹海峡

伊朗:禁止美以欧船只通过霍尔木兹海峡

新华社
2026-03-05 16:37:04
成都“活力28”将开新厂:一度濒临倒闭,“三个老头”直播救厂出圈,靠真诚留流量

成都“活力28”将开新厂:一度濒临倒闭,“三个老头”直播救厂出圈,靠真诚留流量

红星新闻
2026-03-05 20:54:22
太惨了!34岁字节程序员被裁当场崩溃痛哭,房贷2.6万月支出近4万

太惨了!34岁字节程序员被裁当场崩溃痛哭,房贷2.6万月支出近4万

乌娱子酱
2026-03-05 16:16:25
亡母被结婚后续:舅舅曝光炸裂,错换人生,以擦边主播谋生再翻身

亡母被结婚后续:舅舅曝光炸裂,错换人生,以擦边主播谋生再翻身

离离言几许
2026-03-05 16:57:11
突然跳水!刚刚,霍尔木兹海峡,重磅消息!

突然跳水!刚刚,霍尔木兹海峡,重磅消息!

中国基金报
2026-03-05 16:02:42
“这点钱,掉地上都懒得捡!”女孩穷酸生日宴,让父亲被全网讨伐

“这点钱,掉地上都懒得捡!”女孩穷酸生日宴,让父亲被全网讨伐

妍妍教育日记
2026-03-05 23:35:45
万万没想到!两会最火提案不是医疗和就业,而是霍启刚的这一举动

万万没想到!两会最火提案不是医疗和就业,而是霍启刚的这一举动

查尔菲的笔记
2026-03-05 20:24:50
伊朗网红吐槽中国网民,他们都太好战了,根本不懂战争的残酷

伊朗网红吐槽中国网民,他们都太好战了,根本不懂战争的残酷

新游戏大妹子
2026-03-05 12:59:52
A股:今晚2.5亿股民,要兴奋到睡不到觉,你知道为什么吗?

A股:今晚2.5亿股民,要兴奋到睡不到觉,你知道为什么吗?

夜深爱杂谈
2026-03-05 21:01:45
A股:新一轮牛市来临,如果手中有10万资金,建议死啃中字头战法

A股:新一轮牛市来临,如果手中有10万资金,建议死啃中字头战法

股经纵横谈
2026-03-05 17:22:45
全国政协委员张凯丽:建议统一并简化演员署名体系,扭转“唯番位论”畸形风气

全国政协委员张凯丽:建议统一并简化演员署名体系,扭转“唯番位论”畸形风气

封面新闻
2026-03-05 12:24:38
10%的车型将强制清退!中国再落地电车新规:颠覆车越重越安全认知

10%的车型将强制清退!中国再落地电车新规:颠覆车越重越安全认知

快科技
2026-03-04 16:45:06
北京某顶级建工集团崩了,全面停工,全员待岗!

北京某顶级建工集团崩了,全面停工,全员待岗!

黯泉
2026-03-04 21:50:39
突发!郭艾伦突破左膝受伤痛苦倒地翻滚 被担架车给推下场

突发!郭艾伦突破左膝受伤痛苦倒地翻滚 被担架车给推下场

醉卧浮生
2026-03-05 21:19:42
我预计到了三大运营商今年会很难,但没预料到开局就这么难!

我预计到了三大运营商今年会很难,但没预料到开局就这么难!

悲了伤的白犀牛
2026-03-04 08:00:53
2026-03-06 02:27:00
新智元 incentive-icons
新智元
AI产业主平台领航智能+时代
14647文章数 66653关注度
往期回顾 全部

科技要闻

独家|林俊旸辞职 我们和认识他的人聊了聊

头条要闻

伊朗:已作好准备应对美国地面行动

头条要闻

伊朗:已作好准备应对美国地面行动

体育要闻

不开玩笑,没人想在季后赛碰上黄蜂

娱乐要闻

谢娜下场撕薛之谦,张杰前女友爆猛料

财经要闻

“十五五”开局之年,这么干!

汽车要闻

15.98万元起 第三代领克03大尾翼版上市

态度原创

健康
家居
房产
艺术
手机

转头就晕的耳石症,能开车上班吗?

家居要闻

奶白柔境 闲卧享时光

房产要闻

超猛!又有2800套房源砸出,2026海口安居房,彻底爆发!

艺术要闻

他偏要画最难的部分——这位韩国画师,只画手脚与人体,惊艳了无数人!

手机要闻

不到200g的小屏旗舰塞进7500mAh电池!一加15T手感稳了

无障碍浏览 进入关怀版