![]()
百万流量下的机器人打工记。
作者丨吴思梦
编辑丨高景辉
上次Figure AI出现在大众目光中,还是5月8日晚那段两分钟的家务视频,在两分钟的时间里,Figure 03两台机器人,用同一个大脑协作完成了一整套房间整理流程。
几天后,Figure AI又创造了一波新的话题度。
三台名叫“Bob”、“Frank”和“Gary”的人形机器人,如今正在美国某个物流仓库里昼夜不停地分拣包裹,并被24小时全天候直播,直播一出,在X和YouTube上围观人数迅速突破了200万。
截至目前,Figure AI已经直播40个小时,远超最初的8小时挑战,并且直播仍在继续,或许这将成为全球最长的一次人形机器人全自主运行公开测试。
而这一切的起源还要追溯到一场来自线上的对决。
01
一条推文引发的“约架”
5月13日,机器人领域的专家和布道者Scott Walter在社媒公开质疑,人形机器达到人类的速度才会具有有限的实用性,而机器人领域的领先者应该能够展示8小时的自主劳动,无需人工干预。
![]()
Figure AI 创始人兼 CEOBrett Adcock 则第一时间回应道:Figure已经每天都这样做。并在Scott Walter质疑他空口无凭时公开声称第二天进行现场直播。
![]()
于是乎,这个被戏称源于“口水仗”的直播空降社媒,迅速引爆了全网关注。
02
自主还是遥控?
对于旁观者来说,这场直播无疑掺杂了太多摆拍的水分。
“机器人又没有人类分拣快,真的有必要吗?”
“是人工贵还是机器贵?”
![]()
也有不少人质疑此次炫技一般的操作为远程操控,不过这也不是Figure第一次陷入“完全自主”能力与人类远程操控之间模糊界限的争议。
早在3月份发布的demo中,机器人在做家务时不仅出现指令发出前的转身预动作,还有握把动作延迟,那时就已经被网友公开质疑为全程“遥控”,甚至连马斯克都曾在社交媒体上公开质疑。
![]()
直播画面中机器人展示的是分拣供包上件环节,此前这项工作内容大部分都是人工处理。快递单下翻是为保障后续读码机器的识读率,尽可能消除褶皱影响,由于快递包裹规格的多样性,供包是全自动分拣的最难实现自动化的环节,也是最考验通用机器人能力的场景,存在几方面的难点。
首先是包裹形态。直播中快件形态全为软包,机器人必须具备极高的视觉感知能力和自适应抓取能力——不是复制同一个动作,而是每抓一个包裹都可能需要重新调整策略。
第二,操作精度要求高。任务要求机器人检测条形码、抓取包裹、重新调整方向、把条码朝下放到传送带上。
第三,异常需要及时处理。软包起皱、条码被遮挡、一个包裹可能推走的同时另一个已经在手里——这些都是机器人完全凭借摄像头像素进行推理完成的,没有预设路径,没有人工干预。
而围绕着此次直播,网上舆论主要集中在两个点:一个是机器人挠头,一个是骑摩托姿势。
▪ 机器人挠头
![]()
在直播过程中,Figure机器人偶尔会无预兆地出现挠头这一动作,被网友被调侃“可能是VR眼镜戴久了”,但Brett Adcock随即回应:在跨身体伸展时,这个行为会抬起手臂以避免撞到金属斜槽。
▪ 机器人“骑摩托”
摩托车手势更是被网友调侃为“骑哈雷的小男孩”。
针对网友讨论的焦点,业内专业人士告诉AI科技评论,“头显方面说不清,但所谓的骑摩托,可能只是机器卡住了,复位一下接着干,因为包裹很简单,盒子就两种,软包除了颜色都是一模一样,如果是遥操,为什么不展示更多不同的SKU?”
相比任务本身的难度,直播是否存在“远程操控”更令人在意。面对众多质疑虽然Figure AI矢口否认,但并不足以完全打消大众的疑虑。
03
三台机器人的流水线“真人秀”
Figure 03在已经过去的长达30多小时的直播中,展示了一套接近于完美的全自动闭环:识别包裹、精准扫描,灵活调整软包和硬箱的抓取姿态,翻面放置,一气呵成,并且整体成功率很高。而当电量耗尽时,它会自主请求队友接替并前往维护区,完全无需人类插手。
在真实的仓储环境里,偶尔会有项目人员进来查看,除此之外再无其他,直播似乎只是一场单纯的展示。
据悉,Figure 03机器人大脑采用的是Figure最新自研的Helix 02,与第一代专注于上半身控制不同,Helix 02实现了全身端到端控制,拥有一套统一的视觉运动神经网络,可以让机器人完成全身一体化控制,包括行走、操作和平衡。
同时,Helix采用隐式立体视觉技术,能融合多个时序图像帧与传感器反馈,无需外部校准即可精准理解三维空间,显著提升了对软包装袋等非标准形态的处理可靠性。它还配备视觉记忆模块,能从系列视频帧中组合特征形成短期视觉记忆,即使在初始图像中没有完全显示标签,也能调用之前帧的信息寻找标签。
虽然效率数据算不上亮眼,但是三个机器人能够在5小时内处理6700件包裹,且中间并未停歇,平均下来,每个包裹处理时间约3秒,据亚马逊类似任务的基准测试显示,人工分拣速度为每分钟30到40个,Figure 03的作业能力已经接近人类水平。
在直播中,机器人也贡献了很多名场面。
▪ 抓取过程中,会由于空间测算出现短暂失误
▪ 偶尔会把包裹推到传送带外面,导致包裹掉到地上
04
不止Figure,
国内人形机器人厂商早已布局
此次直播并非是一次心血来潮的对战或者说炫技,Figure 能取消原定的8小时直播直接开启无限直播模式,更是想借助已有的话题度把机器人本体 Figure 03 和 Helix 02 模型协作的稳定性,以及它们在工厂中能实际运用的价值展现在众人面前,特别是今年以来,已经有越来越多的机器人公司开始写出商业化落地的真实案例。
其实在Figure AI引发热潮之前,不少机器人公司已在探索双足或轮式的人形机器人在工业场景的落地。
优必选Walker S2其实已经批量进入汽车制造、智慧物流等场景。早在2024年10月时就进入比亚迪汽车工厂,与L4级无人物流车、无人叉车、工业移动机器人和智能制造管理系统协同作业。
![]()
在去年的机器人大会上,智元机器人在展台1:1复刻德马物流中心场景,智元精灵G1进行物流分拣供包作业,作业内容为软包,期间还要面对嘉宾时不时的“捣乱”。在今年4月中旬,智元精灵G2就已经在龙旗科技南昌平板厂跑了一场8小时真实产线直播。
![]()
星动纪元自研人形机器人“星动M7”,不久前在中国邮政广州邮区中心正式上岗,能分拣软包、硬盒、不同规格包裹,还能翻转包裹确保面单朝上,同时识别异常件。
![]()
就连曾经的人形机器人“顶流”Agility Robotics也赶上这波热度,称旗下人形机器人 Digit 自2023年以来一直在物流领域持续运营,刷了一波存在感。
![]()
而截至发稿,直播仍在继续,三台机器人仍在不知疲倦地重复着抓取、扫描、翻面、放置的循环,屏幕上的观看人数还在跳动……
未经「AI科技评论」授权,严禁以任何方式在网页、论坛、社区进行转载!
公众号转载请先在「AI科技评论」后台留言取得授权,转载时需标注来源并插入本公众号名片。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.