网易首页 > 网易号 > 正文 申请入驻

瞭望 | 何时摆脱遥控器

0
分享至

  触觉融入、硬件、模型等方面的挑战,制约着具身智能向通用智能演进

  文 |《瞭望》新闻周刊记者 王鹤 龚雯

  从央视春晚上宇树机器人“扭秧歌”开始,中国具身智能正以惊人速度成长,跑马拉松、打拳击、踢足球、跳街舞,还可以在汽车工厂“上岗”……每一个“惊人”的技能都在凸显这个行业的发展新高度。

  “这些花样玩活的视频放出来,把大家的胃口吊起来了,容易让人误判形势,以为机器人已经高度成熟,可以做很多高难度事情,就快上天入地、无所不能了。”一位工业机器人企业高管感叹,我们需要透过“表面繁荣”,看到具身智能的实际能力。

  细心的人会发现,几乎所有做高难度动作的机器人身旁,都有一位人类工程师在遥操,或者机器人提前植入了程序,也就是说,这些机器人还是“提线木偶”,需要人类“把着手”做事。

  具身智能何时才能摆脱遥控器,距离“全自主”还有多远?

  大脑“进化”

  突破遥操的关键是要具备强大大脑,即机器能够理解物理世界并与之交互,实现感知—决策—执行—反馈的闭环。以自动驾驶领域为例,VLA大模型(视觉—语言—行动模型)、端到端强化学习和世界模型是三类核心技术要素,三者协同实现机器从感知环境到执行动作的自主智能。

  VLA大模型融合视觉、语言和动作三种模态,用于让机器人理解环境、接受指令并执行物理动作,是具身智能基础模型。今年6月银河通用发布了面向零售场景的大模型GroceryVLA,实现机器人对复杂环境的自主决策与精准执行,例如当人类发出“帮我拿点吃的”指令后,机器人无需遥操作,无事先采集场景数据,通过自主规划路径,从货架中识别并抓取饼干饮料送达。

  端到端强化学习是能够直接从图像、传感器数据等原始输入到动作输出的强化学习系统,中间不依赖路径规划器等模块,是训练VLA大模型的关键方法。在2025世界人形机器人运动会上,清华大学教授、机器人控制实验室主任赵明国带领的机器人足球队“清华火神队”赢得足球赛冠军。比赛中机器人已实现无遥操,能够走、跑、跳、翻跟头,具备在复杂、有障碍物路面上行走所需的平衡和适应能力。赵明国团队的核心突破是采用端到端强化学习算法,直接将机器人的视觉信号,如球的位置、队友/对手的位置、球场边界等映射到运动控制指令,实现机器人的行走方向、踢球力度、身体姿态调整。

  世界大模型是模拟环境动态的“虚拟大脑”,其核心是通过学习环境的物理规律,如物体运动、碰撞后果,预测未来状态,为VLA大模型提供环境认知支持。在攻坚世界模型技术瓶颈方面,智元近期发布了自主研发的世界模型GE。相比传统机器人的你说什么、它做什么,GE通过学习物理规律、环境动态,在内部预测未来状态,模拟人类“脑内推演”,从而让机器人具备了主动预判与决策的能力,像人一样先想、再练、后做。搭载该模型的机器人已实现“做三明治”“倒茶”“擦桌面”等任务。GE平台开放底层架构,未来或成为机器人界的“安卓系统”。

  通用智能还需突破核心挑战

  具身智能大脑技术不断有突破,但要实现通用智能,让机器像人一样“理解”环境,具备举一反三的泛化能力,受访专家认为目前水平差距极大。“机器人在某些特殊场景下能自主完成动作,比如足球比赛,但到了别的场景就不会了。”赵明国说。

  业界专家认为,触觉融入、硬件、模型等方面的挑战,制约着具身智能向通用智能演进。

  触觉融入方面,机器人从“看得见”走向“摸得着、懂力度、会适应”任重道远。VLA大模型整合了视觉、语言、动作三种模态,如果再加上触觉则困难重重。触觉感知是一个多维度感知的能力,除了力度感知外,还涉及材质感知,比如表面干性程度、温度高低、柔性还是脆性等。

  “当视觉数据跟触觉数据加在一起,要考虑的有效数据元素过多,模型体量增大,难度也必然提升。”他山科技CEO、联合创始人马扬举例,他山科技正在研究机器人剥小龙虾任务,这种看似非常简单的精细动作,实则需要大量的训练和学习。“我们目前在武汉招募了十几个人的团队做小龙虾项目,计划今年底完成模型训练,并推进小批量试验。”

  硬件方面,具身智能本体端部署的大模型,对算力水平要求高,专用芯片仍不够成熟。“需要加速发展低功耗、高性能且专用于具身智能大模型的芯片;同时将大参数模型轻量化、小型化,并保证在执行任务时性能不会大幅下降。”一位高校具身智能专家提出。

  算法层面,业界仍难以训练出强泛化能力的大模型。中国信息通信研究院人工智能所安全与具身智能部副主任张蔚敏介绍,在3D场景中的情景问答(SQA3D)任务中,当前最先进的模型准确率已提升至55%~60%区间,但仍远低于人类的90.06%,这表明算法成熟度不够高。

  此外,目前探讨的具身智能多为单体智能,在实际应用中,多台机器人协同工作的群体智能,亦是行业需要攻克的课题。

  不可否认,具身智能产业飞速发展,泛化能力正越来越强大。“部分场景乐观估计三五年就能在技术上实现突破。”赵明国表示。

  分级分类加快落地

  加速实现通用智能,仅靠实验室环境无法模拟复杂场景的动态不确定性,需要在真实落地场景中暴露问题并找到解决方案。“具身智能需要一个标准分层,有标准就可以实现技术对齐,加速产品落地。”瑞银证券中国工业分析师王斐丽说。

  目前,国内一些行业机构效仿智能驾驶分级标准,提出了具身智能相关分级框架,以加快技术进步和场景落地。

  例如,2024年10月国家地方共建人形机器人创新中心联合行业内企业和机构,在上海发布了《人形机器人分类分级应用指南》团体标准和《具身智能智能化发展阶段分级指南》团体标准。

  北京人形机器人创新中心有限公司牵头制定的团标《人形机器人智能化分级》从感知、决策、执行、协作四个维度建立了四维五级评价体系,给出了通用安全底线,明确了不同等级机器人的能力要求和适用场景,有助于加速推动人形机器人在特种作业、物流搬运、教育科研、商业服务、健康养老等多领域的应用落地,打破技术与场景之间的壁垒。

  受访专家建议,参照自动驾驶在封闭场景和开放场景中不同等级的应用,加速人形机器人等分级应用。工厂车间等封闭场景,障碍物、光线、地形等因素都比较容易预测和控制,高等级人形机器人可以在这样的环境中更稳定地执行复杂任务,如进行高精度的零件装配、特定区域的货物搬运等。而开放场景,具有高度的不确定性,人形机器人在这些场景中运行需要应对各种突发情况,因此可以使用较低等级的人形机器人执行一些特定任务,如引导服务、物品配送等,逐步积累开放场景运行经验。■

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
11年收割200亿,坑惨10万家庭,这个金融骗子终食恶果!

11年收割200亿,坑惨10万家庭,这个金融骗子终食恶果!

青眼财经
2026-06-24 08:00:23
中午还一起喝酒,晚上就被朋友酒瓶砸头,男子次日凌晨车内离世;警方已立案

中午还一起喝酒,晚上就被朋友酒瓶砸头,男子次日凌晨车内离世;警方已立案

大风新闻
2026-06-24 18:42:20
下一场他会进球!加纳巫师称已解除诅咒,“释放”英格兰队长凯恩

下一场他会进球!加纳巫师称已解除诅咒,“释放”英格兰队长凯恩

全景体育V
2026-06-24 19:06:39
消费实在太惨了,人都麻了

消费实在太惨了,人都麻了

七叔东山再起
2026-06-24 23:32:48
娜然辱华言论曝光,霍家婚讯紧急刹车,郭晶晶一句话把门堵死了

娜然辱华言论曝光,霍家婚讯紧急刹车,郭晶晶一句话把门堵死了

李橑在北漂
2026-06-22 16:20:54
争议!英格兰1.3亿帝星捂嘴交流未染红 巴拉圭愤怒上诉:质疑双标

争议!英格兰1.3亿帝星捂嘴交流未染红 巴拉圭愤怒上诉:质疑双标

我爱英超
2026-06-24 20:08:56
夏至后,中老年:别太心疼钱,这3种零食,每天吃点,阳气足

夏至后,中老年:别太心疼钱,这3种零食,每天吃点,阳气足

阿龙美食记
2026-06-23 15:30:08
中国银行逃税23.67亿被通报

中国银行逃税23.67亿被通报

虎视财经
2026-06-24 14:37:55
世界杯小组赛前两轮收官,最新夺冠概率:法国跌至第2,葡萄牙第6

世界杯小组赛前两轮收官,最新夺冠概率:法国跌至第2,葡萄牙第6

球场没跑道
2026-06-24 13:51:38
卖了500多万元,出厂价仅几毛钱!上百人受骗,广州警方:7家店抓了120人

卖了500多万元,出厂价仅几毛钱!上百人受骗,广州警方:7家店抓了120人

中国经济网
2026-06-24 14:38:37
0-0战平+红牌:伊朗升至榜首,比利时陷绝境

0-0战平+红牌:伊朗升至榜首,比利时陷绝境

简简单单的说
2026-06-22 22:58:49
Windhorst:詹姆斯愿意和骑士签约,湖人愿与其先签后换得到艾伦

Windhorst:詹姆斯愿意和骑士签约,湖人愿与其先签后换得到艾伦

懂球帝
2026-06-25 00:46:06
湖南“副院长出轨眼科主任”事件进展:女方曾某已离职,男方祖某某已恢复出诊;此前官方介入,通报称将依规依纪严肃处理

湖南“副院长出轨眼科主任”事件进展:女方曾某已离职,男方祖某某已恢复出诊;此前官方介入,通报称将依规依纪严肃处理

大风新闻
2026-06-24 20:18:21
中国正式改口!以后不叫“日本政府”了,新称呼传递的信号不一般

中国正式改口!以后不叫“日本政府”了,新称呼传递的信号不一般

潘冹旅行浪子
2026-06-23 00:04:49
真兰仪表:公司董事张蓉逝世

真兰仪表:公司董事张蓉逝世

界面新闻
2026-06-24 17:01:27
张家界大庸古城将重新开业!曾因耗资24亿4年亏损超10亿被焦点访谈“关注”

张家界大庸古城将重新开业!曾因耗资24亿4年亏损超10亿被焦点访谈“关注”

红星新闻
2026-06-24 19:33:08
罗纳尔多怒斥西班牙媒体假新闻:我从没说过梅西是“史上最佳球员”

罗纳尔多怒斥西班牙媒体假新闻:我从没说过梅西是“史上最佳球员”

海阔山遥YAO
2026-06-24 17:39:59
没有证据?那就发明证据!从中国第一“女福尔摩斯”到冤案制造者

没有证据?那就发明证据!从中国第一“女福尔摩斯”到冤案制造者

许三岁
2026-06-24 11:06:59
金价,跳水!金饰克价年内大跌超460元,金店店员:金价越跌,消费者就越谨慎!已有8家国际大行下调金价展望

金价,跳水!金饰克价年内大跌超460元,金店店员:金价越跌,消费者就越谨慎!已有8家国际大行下调金价展望

每日经济新闻
2026-06-24 20:39:50
将11只私募基金包装成公募基金、逃避税23.67亿元,中行回应

将11只私募基金包装成公募基金、逃避税23.67亿元,中行回应

澎湃新闻
2026-06-24 21:38:31
2026-06-25 03:47:00
新华社 incentive-icons
新华社
新华社是国家通讯社
690022文章数 2435239关注度
往期回顾 全部

科技要闻

豆包专业版上线:定价68-500元每月

头条要闻

15岁男孩肥胖诱发糖尿病 抢救无效离世

头条要闻

15岁男孩肥胖诱发糖尿病 抢救无效离世

体育要闻

字母哥,会把凯尔特人拆了吗?

娱乐要闻

向佐向佑兄弟合体直播!母子终于和解

财经要闻

逃税23亿:审计署年报直指七家机构

汽车要闻

施鹏泽:为什么奥迪E7X强调座舱气味安全?

态度原创

教育
时尚
数码
家居
旅游

教育要闻

2026高考分数线最新汇总!12省已公布,含艺术类各专业分数线

那些搞砸高考的年轻人,人生完蛋了吗?

数码要闻

三星电子公众号注销!家电业务已官宣退出中国大陆市场

家居要闻

绿意盎然 自然之境

旅游要闻

昆明闹市藏短巷,曾遍开赤红鹦哥花,一头贡象改了整条街名!

无障碍浏览 进入关怀版