品玩12月3日讯,据pandaily 报道,字节跳动Seed团队近日推出新型强化学习框架GR-RL,显著提升视觉语言动作(VLA)模型在长时间、精细操作任务中的能力。
该框架通过从离线数据筛选到在线实机微调的全流程优化,首次实现机器人连续完成整根鞋带穿引全过程,成功率达83.3%。
相较此前基于监督学习的GR-3模型,GR-RL将穿鞋带任务成功率从45.7%大幅提升近一倍,失败率降低近70%,标志着机器人灵巧操作能力取得重要进展。该成果为复杂精细操作的自动化提供了新路径。
![]()
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.