网易首页 > 网易号 > 正文 申请入驻

Ai2发布面向真实环境的开源机器人基础模型MolmoAct 2

0
分享至

艾伦人工智能研究院(Ai2)近日发布了MolmoAct 2,这是一款开源机器人基础模型,旨在提升机器人在真实物理环境中执行任务的能力。随着研究人员持续突破高度受控的实验室演示场景,业界正朝着更具适应性的自动化系统迈进。


这款由西雅图AI研究机构发布的新模型,被定位为其前代MolmoAct系统的重大升级版本,也折射出业界在开发更通用机器人AI方面的整体趋势——这类系统能够在无需大量特定任务编程的情况下,适应不断变化的环境。

Ai2将MolmoAct 2描述为"面向真实世界运作机器人的开放基础",并指出当前许多机器人系统仍然过于脆弱,且高度依赖针对特定狭窄应用场景的调优。

"AI已经能为我们撰写邮件、调试代码、预订机票。但在物理世界中,它依然举步维艰,"Ai2在发布公告的博客文章中写道。

"让机器人可靠地完成装碗碟或在实验室准备试管样本这类任务,对大多数系统而言仍是连续运行数小时都难以做到的事情。"

与许多依赖固定程序或大量针对单一任务调优的机器人模型不同,MolmoAct 2采用了Ai2所称的"动作推理模型"架构,使系统能够在执行动作前对三维环境进行推理分析。

据官方介绍,该模型能够"开箱即用"地执行多种操作任务,包括双臂协作动作,如折叠毛巾、物品分拣、托盘搬运和清理桌面等。

Ai2表示,与原版MolmoAct系统相比,新模型的推理速度也有显著提升,从而实现了更灵敏的机器人控制响应。

"在基础模型中,单次动作调用约耗时180毫秒,启用自适应深度推理的MolmoAct 2约耗时790毫秒,而MolmoAct的耗时则高达6700毫秒,"官方表示。

Ai2认为,这一速度提升让机器人的行为更接近实时响应,而非动作之间存在明显延迟。

此次发布包含完整的模型权重、数据集以及一个开源机器人动作Token器,体现了Ai2在机器人领域推进开放AI开发的一贯理念——而该领域的许多领先系统至今仍以专有形式存在。

除模型本身外,Ai2还同步发布了MolmoAct 2-Bimanual YAM数据集,并将其描述为"迄今发布的最大规模开源双臂桌面操作机器人数据集",包含超过720小时的机器人演示数据。

这些演示涵盖多种双臂协调任务,例如折叠毛巾、扫描商品、为智能手机充电以及清理桌面。

Ai2表示,该模型在模拟环境和真实机器人评估中均表现出色。

在使用Franka机械臂进行的测试中,MolmoAct 2据报在多项操作任务上取得了较高成功率,包括将物体移入碗中、将移液管放入托盘以及将物体插入狭小空间等。

此外,该公司还表示,在Cortex AI开展的第三方评估中,该系统的表现超越了多款竞争机器人模型。

此次发布中,尤为值得关注的是其在科学研究环境中的早期应用。

Ai2透露,斯坦福医学院的研究人员正在一个由孔乐教授主导的"自驱动湿实验室"项目中,试点将MolmoAct 2应用于CRISPR基因编辑工作流程。

据Ai2介绍,该机器人系统被用于自动化执行重复性实验室操作任务,例如在各工作站之间传递样本、操作台式设备等。

Ai2表示,这项工作凸显了机器人基础模型通过自动化重复性实验室操作来加速科学研究的潜力。

"在对多款针对其工作流程进行微调的通用机器人模型进行测试后,斯坦福团队发现,MolmoAct 2在优化湿实验室关键环节、进而加速科学发现方面展现出强大潜力,"Ai2表示。

尽管取得了上述进展,Ai2也坦承该系统目前仍存在一定局限性。

官方表示,MolmoAct 2目前采用批量规划动作的方式,而非实时持续调整运动轨迹,这在遭遇突发事件时可能会降低系统的响应能力。

此外,该模型目前仅限于其接受过专项训练的机器人平台,若要部署于差异显著的硬件配置上,则需要进行额外的训练工作。

尽管如此,此次发布仍折射出开放机器人基础模型领域不断增长的发展势头,研究人员正努力构建能够在真实环境中更灵活运作的系统。

"对任何机器人模型而言,真正的考验在于它能否在受控环境之外正常运作——在那里,指令会有所不同,而小错误也可能随时间不断累积,"Ai2表示。

MolmoAct 2的模型权重、数据集、技术报告及代码现已通过Ai2研究平台向公众开放。

Q&A

Q1:MolmoAct 2是什么?它有哪些核心能力?

A:MolmoAct 2是由艾伦人工智能研究院(Ai2)发布的开源机器人基础模型,采用"动作推理模型"架构,能够在执行动作前对三维环境进行推理。它支持开箱即用地执行折叠毛巾、物品分拣、托盘搬运等双臂协作任务,推理速度相比前代大幅提升,单次动作调用仅需约790毫秒,是前代的近九分之一。

Q2:MolmoAct 2与其他机器人模型相比有什么优势?

A:MolmoAct 2的主要优势体现在三个方面:一是速度更快,推理时延从前代的6700毫秒大幅降至790毫秒;二是开放性强,完整发布了模型权重、数据集和开源动作Token器;三是配套了目前规模最大的开源双臂桌面操作数据集,包含超过720小时的演示数据。在第三方机构Cortex AI的评估中,其表现也优于多款竞争模型。

Q3:MolmoAct 2目前有哪些已知局限性?

A:MolmoAct 2目前存在两项主要局限:第一,它采用批量规划动作的方式,无法实时持续调整运动,在遭遇突发状况时响应能力有限;第二,该模型目前仅支持其接受过专项训练的机器人平台,若要在差异较大的硬件配置上部署,需要进行额外的针对性训练。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
追踪德国华人迷奸案,性犯罪何以组成“共同体”?

追踪德国华人迷奸案,性犯罪何以组成“共同体”?

南方都市报
2026-05-26 09:22:24
投毒杀人者、 三体公司原CEO许垚被执行死刑:他使用了见效更快、毒性更强的毒剂

投毒杀人者、 三体公司原CEO许垚被执行死刑:他使用了见效更快、毒性更强的毒剂

志云说
2026-05-26 13:05:30
你们都是什么时候对男女之事开窍的?网友:果然还是拦不住有心人

你们都是什么时候对男女之事开窍的?网友:果然还是拦不住有心人

夜深爱杂谈
2026-02-21 21:37:02
警惕未成年发生性关系,网友说19岁男子跟13岁女孩发生关系获刑!

警惕未成年发生性关系,网友说19岁男子跟13岁女孩发生关系获刑!

灯锦年
2026-05-25 12:40:14
三十万顶大盖帽,一夜之间说没就没了。

三十万顶大盖帽,一夜之间说没就没了。

笔墨V
2026-05-26 06:09:38
乌克兰袭击学校宿舍,军事专家:因俄军击落乌军一架远程指挥飞机

乌克兰袭击学校宿舍,军事专家:因俄军击落乌军一架远程指挥飞机

健身狂人
2026-05-26 12:26:41
陕西老总3年赚42亿,女秘书换12个,知情人士吐露:吃人不吐骨头

陕西老总3年赚42亿,女秘书换12个,知情人士吐露:吃人不吐骨头

悬案解密档案
2025-05-19 14:44:14
800万年薪!杨鸣弃辽宁投北京,铁腕能镇住更衣室吗?

800万年薪!杨鸣弃辽宁投北京,铁腕能镇住更衣室吗?

观星娱记
2026-05-26 12:39:24
中东核基地被炸成火海!伊朗先下手为强,特朗普紧急叫停决战

中东核基地被炸成火海!伊朗先下手为强,特朗普紧急叫停决战

最新声音
2026-05-23 19:32:27
云南高院以涉密决定不公审的贪污案,被证实依据错误

云南高院以涉密决定不公审的贪污案,被证实依据错误

法治边角料
2026-05-25 23:17:16
四川5地登上全国高温榜!今起四川大部有雨,局地有强降水、雷暴大风

四川5地登上全国高温榜!今起四川大部有雨,局地有强降水、雷暴大风

鲁中晨报
2026-05-26 09:10:07
燃气公司上门安检,根本不是查漏气!真实目的其实是这3个

燃气公司上门安检,根本不是查漏气!真实目的其实是这3个

小影的娱乐
2026-05-23 20:32:29
胡彦斌也开始用 AI 写代码了,还说 “Vibe Coding 的都懂这个姿势!” 我怒怼:“花哨,不如我来教你 9 大 AI 编程提效技巧吧!”

胡彦斌也开始用 AI 写代码了,还说 “Vibe Coding 的都懂这个姿势!” 我怒怼:“花哨,不如我来教你 9 大 AI 编程提效技巧吧!”

程序员鱼皮
2026-05-25 22:45:26
B费:我找索帅要了基恩的电话,我不喜欢他歪曲我的言论

B费:我找索帅要了基恩的电话,我不喜欢他歪曲我的言论

懂球帝
2026-05-25 22:03:20
赴陆活动重申“和平兴台”,萧旭岑:台湾人也是堂堂正正的中国人

赴陆活动重申“和平兴台”,萧旭岑:台湾人也是堂堂正正的中国人

海峡导报社
2026-05-26 10:42:25
他建国前战功平平,建国后却立不世之功,毛主席直言堪比三大战役

他建国前战功平平,建国后却立不世之功,毛主席直言堪比三大战役

比利
2026-05-26 10:25:21
准时上硬菜,中国发布5号公告,冯德莱恩沉默,欧盟错失最后机会

准时上硬菜,中国发布5号公告,冯德莱恩沉默,欧盟错失最后机会

游古史
2026-05-26 10:50:36
孙子在我家吃住8年,考上大学我卖房旅游,儿媳:我的钱你凭啥花

孙子在我家吃住8年,考上大学我卖房旅游,儿媳:我的钱你凭啥花

茶余饭后故事会
2026-05-25 11:39:19
刘銮雄又拍卖佳酿卖了3685万,最贵一瓶65万,五年卖酒成交2.75亿

刘銮雄又拍卖佳酿卖了3685万,最贵一瓶65万,五年卖酒成交2.75亿

好贤观史记
2026-05-24 13:21:38
单日票房断崖下跌,《给阿嬷的情书》后继乏力,20亿票房梦要碎了

单日票房断崖下跌,《给阿嬷的情书》后继乏力,20亿票房梦要碎了

影视高原说
2026-05-25 18:21:42
2026-05-26 13:43:00
至顶科技 incentive-icons
至顶科技
科技产业媒体与 AI 产业服务机构
18746文章数 49707关注度
往期回顾 全部

科技要闻

今年秋季,麒麟芯片将首次落地"逻辑折叠"

头条要闻

上海一小区车库土多得离谱 居民吐槽:不敢呼吸

头条要闻

上海一小区车库土多得离谱 居民吐槽:不敢呼吸

体育要闻

上赛季差点降入英甲,下赛季要踢英超了

娱乐要闻

景甜被曝停工失联 富商索要2亿和解费

财经要闻

中国铝行业爆单 下一个“煤炭”大周期?

汽车要闻

纯电续航310km 2026款海狮06DM-i上市售12.99万元起

态度原创

家居
艺术
数码
本地
公开课

家居要闻

生与命相依 旧公寓改造

艺术要闻

画美,文字也美 | 日本著名画家内田正泰

数码要闻

20年前单核老U硬刚现代AI!奔腾4运行Llama 3.2实测:答一题33分钟

本地新闻

用云锦的方式,打开江苏南京

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版