网易首页 > 网易号 > 正文 申请入驻

机器人"大脑"真能批量生产了!智元、宇树们开始共享"大脑"了?

0
分享至

具身智能产业发展确实快,展会上的机器人越来越炫酷,但真正能规模化应用的依然不多。

这个产业现在的状态,像极了2010年的计算机视觉——技术曙光初现,但整个行业还在"摸着石头过河"。不同企业用不同开发框架,数据格式五花八门,连对同一个任务的定义都能吵起来。

最要命的是,大家都在重复造轮子,却很难形成合力推动产业进步。

上海AI实验室看不下去了。

在刚刚结束的2025世界人工智能大会上,他们发布了『书生』具身全栈引擎Intern-Robotics。这个平台的野心不小——要给具身智能建立标准化"生产线"。

它有多猛?智元机器人、宇树科技、银河通用、国地共建人形机器人创新中心等15家头部玩家已经抢先上车。从人形到四足,从机械臂到轮式机器人,各种形态的机器人都在用同一套系统搞研发。

某种程度上说,这可能是具身智能领域的"安卓时刻"。

▍仿真引擎:让试错成本降低几个数量级

在传统的机器人开发中,每一次算法调整都需要在真实机器人上反复测试。这不仅烧钱烧时间,更要命的是——你敢让价值百万的人形机器人去试各种"花式摔倒"吗?

机器人领域有个特点,它要求100%成功。大模型说错话,用户一笑了之;机器人摔一跤,可能就是几十万的损失。

这种对可靠性的极高要求,让充分的测试验证成为必需。但在现实中,你不可能让机器人真的去尝试所有可能的碰撞和失败情况。一个简单的抓取动作,可能涉及数百种不同的物体形状、材质和摆放角度,每种情况都需要反复测试。

Intern-Robotics的仿真引擎直接把这个问题给解了。基于升级版的桃源系统(现更名Intern·Utopia),上手门槛低到离谱:1行代码就能跨机器人部署算法,3行代码定义任务,5分钟直接开干。

这种极简设计背后,是对开发者痛点的深刻理解。传统仿真系统,光是环境配置就能折腾几天,更别提后续的参数调试和算法适配。现在,一个刚入行的工程师也能快速上手,把更多精力放在算法创新上。

技术上最狠的是"图式控制器级联设计"——翻译一下就是,你可以在一个环境里同时搞定路径规划、运动控制、精细操作,不用在不同仿真器之间反复横跳。

这解决了一个长期困扰行业的问题:高层规划与底层控制的耦合。以往,测试导航算法用一个仿真器,测试抓取用另一个,测试全身协调又得换一个。不同仿真器之间的数据格式、物理引擎、接口标准都不一样,光是做适配就要耗费大量时间。

更绝的是分布式部署能力。想测试仓库里1000个机器人协同搬货?虚拟环境里随便造,各种极端情况任你折腾。反正是虚拟的,摔坏了不心疼。

这种能力对于多机协作场景尤其重要。在真实环境中,测试100个机器人的协同工作几乎不可能——光是场地和设备成本就是天文数字。但在虚拟环境中,你可以轻松模拟各种复杂场景:机器人之间的碰撞避让、任务分配、路径规划冲突等等。

仿真环境的另一个价值在于极端场景的测试。火灾、地震、设备故障——这些在现实中难以复现的情况,在虚拟世界里都能随意创建。这对于提高机器人系统的鲁棒性至关重要。

▍虚实数据贯通:用最小成本获得最大效果

数据是训练机器人的口粮,但这口粮在机器人圈贵得离谱。

完全靠真机器人采集数据?效率低不说,很多场景你根本采不到——总不能为了训练让机器人真的从楼梯上滚下去吧。

更现实的问题是成本。一个工业机械臂采集一天数据,需要专业操作员、场地租金、设备折旧,算下来成本可能上万。而要训练一个可靠的模型,往往需要数十万甚至数百万条数据。

Intern-Robotics的解法很巧妙:虚实融合。

庞江淼透露了个关键比例:"根据任务难度,真实数据与合成数据的比例在1:5到1:10之间。"这个比例不是拍脑袋想出来的,而是基于大量实验得出的最优配比。

对于导航这种主要靠"看"的任务,纯合成数据就能搞定。因为导航主要依赖视觉感知和空间推理,这些在虚拟环境中可以高度还原。但对于抓取这种需要"摸"的任务,物体的质地、重量、摩擦力等物理属性很难完全模拟,还是得有真实数据撑腰。

平台的数据引擎拥有10万级的场景物体资产,结合神经渲染技术Intern·LandMark和生成式世界模型Intern·WorldModel,可以生成高度逼真的训练场景。这些技术的结合,使得合成数据不仅在视觉上接近真实,在物理交互上也能准确模拟。

效果拉满:单台服务器每天能合成5万条数据,成本比半年前降了66%。整体数据采集成本更是直接干到传统方案的0.06%。

这意味着啥?原本需要砸百万的项目,现在几万块就能启动。对于资金有限的初创公司和研究团队来说,这简直是福音。

在和上海国家地方共建人形机器人创新中心的合作中,这套方法已经跑通。国地中心提供具体场景和高质量真实数据,实验室负责仿真数据合成和模型训练。通过这种虚实结合的方式,青龙机器人在极端场景下的表现提升了40%以上。

数据引擎还提供了完善的数据处理管线。"大模型驱动、人工在环"的半自动化标注方式,既保证了标注质量,又大幅提高了效率。支持2D/3D框、轨迹、抓取点、语义掩码等常见标签,基本覆盖了机器人视觉任务的所有需求。

▍训测一体化:构建标准化的开发流程

有了数据和仿真,怎么高效训练模型?

传统方法的槽点太多:训练用一套工具,测试用另一套,转换过程不仅麻烦还容易出bug。更坑的是,没有统一评测标准,张三说自己的算法牛,李四说自己的更强,谁也说服不了谁。

这种混乱状态严重阻碍了技术进步。研究者发表论文时,往往会挑选对自己有利的测试场景和评价指标。企业宣传产品时,更是各说各话。结果是,外行看热闹,内行也糊涂。

庞江淼坦言:"评测体系确实很难做,这是领域内说了很多年但一直没做成的事。真实世界的机器人行为都是不可复现的,你怎么保证评测的公平性?"

他进一步解释:"评测是对方法进行排序的一种手段。一个合理的评测方式是能够通过分数,分辨出对整个系统做出改动后的好坏。它需要可复现,但真实世界的所有机器人行为都是不可复现的。"

Intern Robotics通过一体化设计解决了这些问题。平台提供了导航(Intern·Nav)、操作(Intern·Manip)、人形控制(Intern·Humanoid)、空间推理(Intern·SR)等专门工具库,从数据加载到模型训练再到性能评测,全流程覆盖。

每个工具库都针对特定任务进行了深度优化。比如导航工具库,不仅包含了主流的导航算法,还提供了10个标准化测试场景,涵盖室内导航、室外导航、动态避障等各种情况。操作工具库则包含了5种主流抓取算法和数百种标准测试物体。

最赞的是模块化架构。感知模块、规划模块、控制模块随意组合,就像搭积木一样。你只需要专注自己的创新点,不用重新发明轮子。

这种设计理念带来的好处是显而易见的。一个做视觉感知的团队,可以直接使用平台提供的规划和控制模块,专注于提升感知算法的性能。一个做运动控制的团队,可以使用现成的感知模块,把精力放在控制算法的优化上。

基于这套系统训练的InternVLA系列模型已经开始秀肌肉。模型以InternVL3等多模态大模型为基座,设计了"感知-想象-执行"一体化架构。在导航任务的10项基准测试中达到国际领先水平,首次实现无需额外训练的"跨楼宇、长距离"自主行走;在操作任务的5项仿真评测中同样领先,真机成功率超过业界顶尖模型15%。

还有跨平台能力。"四足机器人和人形机器人在我们框架里其实一样,都用强化学习训练。"庞江淼说,"唯一区别是仿真环境里导入的描述文件不同。"

这种统一的训练范式意义重大。传统上,不同形态的机器人需要完全不同的开发流程和工具链。现在,一个模型可以方便地部署到10余种机器人形态上,大大提高了技术的复用性。

▍开源开放:构建具身智能的"基础设施"

技术再牛,不落地也是空谈。

Intern-Robotics选择了最硬核的验证方式:全面开源。GitHub和Hugging Face上,所有代码和模型都能下载。

这个决策背后,是对产业发展规律的深刻理解。封闭系统或许能在短期内保持技术优势,但开放生态才能推动整个产业的进步。就像Linux之于服务器、Android之于智能手机,开源往往能创造更大的价值。

目前平台已支持6大主流任务、20多种数据集、50多个模型的训练评测。6大任务包括感知(具身空间推理)、导航、交互操作、直接执行操作、世界模型以及人形机器人控制,基本覆盖了当前具身智能研究的主要方向。

数据资源同样给力:17类强推理任务、15种原子技能、10余种主流机器人本体、超2万种场景的200万仿真合成数据。这些数据不是简单的堆砌,而是经过精心设计和标注,可以直接用于模型训练。

据了解,"具身智能光合计划"把开放合作推向深水区。不只是提供工具,还在数据标准制定、采集工具供给、标注自动化等方面提供全方位支持。与成员单位在引擎开发、模型训练、场景落地等环节开展联合攻关,形成技术创新的合力。

不同类型的企业在平台上找到了不同的价值。本体厂商可以使用训练工具优化控制算法,提升机器人的运动性能;应用企业可以快速部署现有模型,加速产品落地;研究机构可以基于平台进行算法创新,推动技术边界。行业内的反馈印证了这种需求的迫切性:

越疆科技联合创始人郎需林直言:“在实际的应用场景中,往往需要多种形态的机器人共同完成一项复杂任务。比如人形机器人、机器狗和机械臂等,它们的算法如果通过统一的‘大脑’来训练,将会大大提高开发效率,业界需要这样更加泛用的具身大脑。”

松灵机器人技术负责人谢志强也有类似感受:“现在具身智能的技术开发很碎片化,从仿真到训练各种工具五花八门,对开发者来说,希望能有一套从仿真到训练的全栈工具链,这将极大降低开发门槛和周期。”

国家地方共建人形机器人创新中心副总经理刘宇飞表示,加入“具身智能光合计划”后,双方已经有了阶段性成果,联合研发的『书生』具身操作大模型InternVLA-A1及相关工具链,显著提升了青龙等异构机器人平台的数据采集多样性、复杂任务训练效率与测试准确率。接下来,双方将深化协同,共建人形机器人实训场、联合开发高价值场景的模型,以及探索新一代软硬件协同架构,打造自主进化智能体,共同推动具身智能技术创新突破与产业变革的深度融合。"

▍量产时代的技术基础:标准化与规模化

从某种意义上说,Intern-Robotics正在做的事,就像当年Android之于智能手机——建立统一的开发标准,降低进入门槛,让更多玩家能参与进来。

标准化是产业规模化的前提。USB接口统一了外设连接,HTTP协议统一了网络通信,而Intern-Robotics要统一的,是具身智能的开发流程。通过统一的数据格式、训练流程、评测标准,让不同的研究成果可以相互借鉴,不同的技术模块可以灵活组合。

"世界范围内首次完成导航、操作等六大具身主流任务的超大规模验证",这不仅是技术实力的体现,更重要的是验证了统一框架的可行性。当开发一套模型就能适配10余种机器人形态,当数据采集成本降到0.06%,当5分钟就能上手开发——具身智能的"iPhone时刻",或许真的不远了。

机器人大规模走进生活的那一天,可能就是从今天这个"安卓系统"开始的。

GitHub:https://github.com/InternRobotics
Hugging Face:https://huggingface.co/InternRobotics
官网:https://internrobotics.shlab.org.cn

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
95后女大学生养了6万多条毒蛇,蛇毒卖西医,蛇胆蛇肉蛇油卖中医,除去人工和成本年入超百万

95后女大学生养了6万多条毒蛇,蛇毒卖西医,蛇胆蛇肉蛇油卖中医,除去人工和成本年入超百万

观威海
2026-04-12 09:52:08
郑丽文刚回到台湾,民进党就发难,民众党摊牌,侯友宜彻底不装了

郑丽文刚回到台湾,民进党就发难,民众党摊牌,侯友宜彻底不装了

小撇说事
2026-04-13 00:15:42
伊朗用血泪换来的教训:一旦中美开战,中国必须首先锁定这一点

伊朗用血泪换来的教训:一旦中美开战,中国必须首先锁定这一点

福建睿平
2026-04-13 10:58:58
120W是“型号”不是功率?误导消费者要付出代价

120W是“型号”不是功率?误导消费者要付出代价

南方都市报
2026-04-13 00:36:10
罗永浩怒喷!120W是充电器商标?这么流氓怎么注册成功的?

罗永浩怒喷!120W是充电器商标?这么流氓怎么注册成功的?

LOGO研究所
2026-04-13 17:29:17
70架运输机出动,以色列迅速回血,巴铁大军进驻沙特,伊朗上当?

70架运输机出动,以色列迅速回血,巴铁大军进驻沙特,伊朗上当?

闻识
2026-04-13 10:17:52
难以置信!上海一大爷在山姆会员店,拿在售剃须刀剃头引发热议

难以置信!上海一大爷在山姆会员店,拿在售剃须刀剃头引发热议

火山詩话
2026-04-13 06:39:17
XChat 来了!马斯克版微信正式发布,国区可下载

XChat 来了!马斯克版微信正式发布,国区可下载

新浪财经
2026-04-12 23:41:21
快讯!伊朗革命卫队明确宣布了!

快讯!伊朗革命卫队明确宣布了!

达文西看世界
2026-04-13 09:35:22
1952年,黄克诚在岳父被判死刑后,找到负责的干部:能否帮个小忙

1952年,黄克诚在岳父被判死刑后,找到负责的干部:能否帮个小忙

云霄纪史观
2026-04-12 16:03:52
万科走向深渊的最大推手——郁亮

万科走向深渊的最大推手——郁亮

地产微资讯
2026-02-06 10:15:49
28万彩礼被父母扣下,女子10年不回娘家,母亲急了,她却说没退路

28万彩礼被父母扣下,女子10年不回娘家,母亲急了,她却说没退路

大鱼简科
2026-04-06 19:39:15
终究还是落槌了。 内塔尼亚胡,这位在政坛翻云覆雨几十载的硬汉

终究还是落槌了。 内塔尼亚胡,这位在政坛翻云覆雨几十载的硬汉

网络易不易
2026-04-13 11:03:04
小宝与王某雷,谁探访花的数量更多?

小宝与王某雷,谁探访花的数量更多?

挪威森林
2026-01-31 12:15:26
巴萨欧冠客战马竞大名单:莱万、亚马尔领衔,贝尔纳尔在列

巴萨欧冠客战马竞大名单:莱万、亚马尔领衔,贝尔纳尔在列

懂球帝
2026-04-13 16:39:09
女子独自带5岁女儿和未满1岁儿子到餐厅用餐,女儿不幸从包间窗户坠亡……法院判了:餐厅赔近74万元,母亲担责三成

女子独自带5岁女儿和未满1岁儿子到餐厅用餐,女儿不幸从包间窗户坠亡……法院判了:餐厅赔近74万元,母亲担责三成

极目新闻
2026-04-12 18:00:56
严惩38号裁判!末节严重双标+4错漏判,公开帮广厦,真是看不下去

严惩38号裁判!末节严重双标+4错漏判,公开帮广厦,真是看不下去

南海浪花
2026-04-13 07:29:25
名记晒清晰视频,实锤廖力生与韦世豪私聊内容,国安上诉再遭打击

名记晒清晰视频,实锤廖力生与韦世豪私聊内容,国安上诉再遭打击

体坛野秀才
2026-04-13 15:06:20
单程决死突击!伊朗飞行员壮烈牺牲,炸翻美司令部,换掉3架美机

单程决死突击!伊朗飞行员壮烈牺牲,炸翻美司令部,换掉3架美机

荷兰豆爱健康
2026-04-12 18:19:03
斯普利特:球员们对附加赛感到兴奋,我曾向波波维奇请教经验

斯普利特:球员们对附加赛感到兴奋,我曾向波波维奇请教经验

懂球帝
2026-04-13 15:35:11
2026-04-13 18:35:00
机器人大讲堂 incentive-icons
机器人大讲堂
立德机器人平台,是一个集媒体品牌、智库咨询、投资孵化、引智招商为一体的机器人垂直领域服务平台
6451文章数 4581关注度
往期回顾 全部

科技要闻

"抄作业"近四年,马斯克版微信周五上线

头条要闻

媒体:美伊马拉松谈判后 还是就一件事达成了共识

头条要闻

媒体:美伊马拉松谈判后 还是就一件事达成了共识

体育要闻

一支球队不够烂,也是一种悲哀

娱乐要闻

贾玲减重后现身冯巩生日宴 身材未反弹

财经要闻

起底AI"造黄"灰产:19.9元"一键脱衣"

汽车要闻

不止命名更纯粹 领克10/10+要做纯电操控新王

态度原创

房产
游戏
本地
时尚
公开课

房产要闻

6000亿投资盛宴,全球巨头齐聚,海南又要干件大事!

曝PS恐怖3A要出续作!第一方工作室接手IP

本地新闻

12吨巧克力有难,全网化身超级侦探添乱

这些才是普通人借鉴的穿搭!上短下长、上窄下宽,显瘦又舒适

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版