网易首页 > 网易号 > 正文 申请入驻

具身智能的GPT时刻何时到来?王兴兴畅谈行业七大焦点话题

0
分享至

元界由《权力、资本与商帮》作者王俞现主理

为什么人形机器人没有得到大规模应用?具身智能的GPT时刻何时到来?是模型的问题,还是数据的问题?到底应该走何种技术路线?为什么具身智能必须解决Scaling law?未来2-5年智能机器人技术的重心是什么?为什么分布式算力是一个重要领域?

8月9日,北京世界机器人大会。宇树科技创始人、CEO王兴兴,在演讲中谈及行业内外关注的这六大焦点话题。

在谈及这六大话题时,他表示,今年上半年,整个机器人行业最大的特点是非常火爆。由于政策的相关支持,整个机器人这块的行情,包括整机厂商、零售厂商,平均至少每家企业有将近50%到100%的增长。这个增长还是非常吓人的,对行业来说还是非常少见的一件事情。需求端,拉动了整个行业的发展。

海外也毋庸置疑,特斯拉机器人公司,今年要量产几千台人型机器人,大概还会发布他们第三代的人型机器人。全球范围内,大家对这块都保有热情。尤其海外的大公司,包括英伟达、苹果等,都非常持续地在推动这个领域的发展。

问题一:

为什么人形机器人没有得到大规模应用?

是机器人的功能不够,还是有人怀疑的是硬件不够好,或者成本比较高?

王兴兴认为,目前的硬件是够用的,某种意义上完全是够用的。人形机器的硬件,哪怕灵巧手、整机,某种意义上完全是够用的,但当然不够好,要持续地把它做得更好,但它更大的问题是要把它量产。

工程上的问题肯定很多,但从技术层面,或者从AI的角度来说,目前的硬件是完全是够用的,最大的挑战来自具身智能的AI、大模型,“它们还是完全不够用,这也是限制机器人尤其人形机器人大规模应用的一个最大的卡点”。

问题二

具身智能的GPT时刻何时到来?

王兴兴表示,目前人形机器人所处的状态,感觉有点像ChatGPT出来前1-3年左右的时间。

他说,大家知道GPT做出来前的几年,语音AI已经做了十几二十年,但是大家一直觉得它很傻瓜、很弱智,根本没法用。GPT出来以后,大家认为性能达到了更好的阶段。目前业界已经发现了类似的方向以及技术路线,但是没人把它做出来。人形机器人还没有到达这个临界点。

而如果具身AI达到这个临界点,会达到什么程度呢?他举例说,如果哪一天我们带一个人形机器到会场,而且这个会场他没有见过,我随便跟他说,让它帮忙把一瓶水带给某个观众,他可以比较顺畅地自己走过去,流畅地把这个事情干了,或者说它能自己把一个完全没有见过的房间整理好的时候,“我觉得就到达了人工智能的ChatGPT时刻”。

如果加上一个时间的刻度呢?王兴兴表示,如果快的话,未来的一两年或者两到三年,还是很有可能实现的。最慢的话,我估计三到五年,也是有很大概率能实现这个概念。

问题三

是模型的问题,还是数据的问题?

关于目前不太够用这件事情,没有达到应有的效果,到底是模型的问题还是数据的问题?

王兴兴认为,全球范围对数据问题关注度,有点太高了。大家觉得有足够多的数据,尤其有足够多好的数据的时候,就能把模型训练得越来越好。现在最大的问题反而是模型的问题,并不是一个数据问题。

他说,在具身智能机器领域,大家可以发现,很多情况下,你数据有了,会发现这个数据用不起来。就目前来说,具身智能机器人的模型架构不够好,也不够统一,很多情况下大家对模型的关注相对有点少。

问题四

到底应该走何种技术路线?

相对目前比较火的是VLA模型(注:Vision-Language-Action Model的简称,即视觉-语言-动作模型),一个相对比较傻瓜式的架构,王兴兴表示,他对VLA模型还持比较怀疑的态度。

“在与真实世界交互的时候,它的数据质量和采集的数据,是不太够用。”他说。即便在VLA模型上加一个RL训练(注:强化学习训练) ,包括他们公司尝试下来,还是不够用,“模型本身还要再升级和优化”。


前几天谷歌发布了全新一代的视频生成模型,或者某种意义上是一个视频驱动的世界模型Veo 3。他说,整个模型架构非常简单粗暴,就是把整个机器人的一些动作序列控制,直接对齐到整个模型的架构。

他说,大家会有一个很自然的想法,如果我控制一个视频生成模型,跟他说,让它帮我生成一个机器人去整理一下房间的视频。如果它能生成的这个视频就已经让一个机器人去做好的时候,我是不是能让这个视频生成模型,直接去驱动一个机器人去做?

他认为这想法非常直接简单,而早在去年,宇树就已经做过这个事情。“大家可以看到这个视频右上角有个小窗口的视频,这个视频就是生成出来的,不是用摄像头采集的,而是我们用一个预训练的视频生成模型,重新训练,让他先生成一个视频和动作,然后再控制一个机器人去做。这个技术是能实现的,包括谷歌的那个视频生成世界模型,他们也想实现这个效果。”


他认为,这个路线方向可能比VLA模型的收敛速度更快,概率更大,但是“我没有验证,不敢打包票”。

这个路线很大的一个问题是,视频生成模型太关注视频生成的质量,导致对GPU的消耗有点大,但是“对于机器人干活来说,某种意义上你并不需要很高精度的视频生成质量,你只要驱动机器人去干活就行了”,他说。

问题五

为什么具身智能必须解决Scaling law?

另外,王兴兴指出,目前还面临的一个大问题是,如果要进一步提升机器人模仿学习的能力,必须解决Scaling law,而这一点目前行业做得并不好。“

目前大家看机器人跳跳舞、做一些格斗,效果还不错,但如果训练一个机器人动作,比如学一支新舞或干一项新的活儿时,往往需要从头开始训练,这非常低效。理想情况下,新的训练应该基于已有训练成果,让训练速度越来越快,学习新技能的效果越来越好。”

王兴兴指出,这是一个非常值得深入研究的方向,Scaling law在语言模型上的成功已经得到验证,但在机器的运动控制上,大家做的还只是刚刚开始。


问题六

未来2-5年智能机器人技术的重心是什么?

对于未来2-5智能机器人技术的重心,王兴兴表示,最大可以肯定的是,还是要做一个统一的端到端的提升智能的AI模型。智能体大模型当下及未来最关键的挑战是机器人大模型。模型本身是最重要的。


第二,就是要有更低成本、更高寿命的硬件,及超大批量的制造,这个是毋庸置疑的。汽车行业已经100多年了,哪怕到今天,一家企业要做一辆很好的汽车出来,它的工程量还是非常大的。对于机器人行业未来,如果每年有几百万、几千万甚至几亿的人形机器人要生产制造出来,对其工程量的挑战是非常吓人的一件事情。

另外,人形机器人也需要低成本、大规模的算力。

问题七

为什么分布式算力是一个重要领域?

在提及算力时,王兴兴表示,在人形机器或者在移动机器人本体上,没办法直接部署很大规模的算力。

为什么呢?因为它的尺寸只有这么大,它的电池只有这么大,它可部署的算力和功耗是有限的。他个人感得,最多只能部署峰值功耗大概只有100瓦的算力,简单说就是只有大概几部手机的算力水平。

他认为,未来人形机器人对大规模算力的需求,可能是一个分布式的算力。如果你在北京干活的机器人,数据中心或者算力中心却在上海或者在内蒙,这个延迟实在是太大了。

所以,他提出的务实做法是,在机器人工厂里面装一个机器人的分布式服务器,把所有的机器人直接连接到工厂里的局部服务器就好,这让它整个服务器的安全性延迟和通讯延迟可以接受。

而换在一个小区,如果每家每户都有一个机器人时,这个小区肯定要有一个分布式的集群算力中心。如果有新的客户想买人形机器人,他也不需要给这部分算力的建设花钱,人形机器人的成本就会降低更多。

他表示,分布式算力未来对于机器人而言会是非常重要的一个领域。

根据王兴兴演讲整理

主理:王俞现 撰文编辑:谷神君

主理微信:imerit

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
刚刚,18家公司出现重大利好和利空公告,有没有与你相关的个股?

刚刚,18家公司出现重大利好和利空公告,有没有与你相关的个股?

股市皆大事
2026-01-18 11:44:22
1972年有人要撤汪东兴的中办厅主任,毛主席:替我转告总理三句话

1972年有人要撤汪东兴的中办厅主任,毛主席:替我转告总理三句话

文史季季红
2026-01-17 18:15:03
观赏欧阳娜娜的最佳视角  娜比也长大了

观赏欧阳娜娜的最佳视角 娜比也长大了

喜欢历史的阿繁
2026-01-18 10:26:22
风雪中,送别“棋圣”聂卫平!北京市民排起长队,韩国名宿到场告别

风雪中,送别“棋圣”聂卫平!北京市民排起长队,韩国名宿到场告别

环球网资讯
2026-01-18 11:31:08
医生发现:大量喝茶的糖尿病患者,用不了多久,身体或有6个变化

医生发现:大量喝茶的糖尿病患者,用不了多久,身体或有6个变化

健康之光
2026-01-18 13:10:09
汪小菲带娃吃日料,玥儿贴心夹菜!汪小菲和大S家已私下进行和解

汪小菲带娃吃日料,玥儿贴心夹菜!汪小菲和大S家已私下进行和解

汪巗的创业之路
2026-01-18 11:50:29
澳网开赛前夕,前俄罗斯名将正式入籍澳大利亚!发文:感恩自由

澳网开赛前夕,前俄罗斯名将正式入籍澳大利亚!发文:感恩自由

全景体育V
2026-01-18 08:59:11
“地震中消失的人去哪了?”网友的扎心评论,直接看哭了上万网友

“地震中消失的人去哪了?”网友的扎心评论,直接看哭了上万网友

另子维爱读史
2026-01-15 18:13:19
北京市中小学,放寒假通知!

北京市中小学,放寒假通知!

美丽大北京
2026-01-18 09:10:40
江苏多地政府主官去代转正

江苏多地政府主官去代转正

上观新闻
2026-01-18 07:33:04
身价上千亿?深扒之下,终于知道李湘的钱都是从哪里来的了!

身价上千亿?深扒之下,终于知道李湘的钱都是从哪里来的了!

清晨的世界
2026-01-18 10:10:27
真敢说!郝帅疑似暗讽王楚钦,网友刷屏:有个好姑父

真敢说!郝帅疑似暗讽王楚钦,网友刷屏:有个好姑父

十点街球体育
2026-01-16 00:00:03
中国向全世界披露:美国4400颗卫星,包围中国空间站,这是要做啥

中国向全世界披露:美国4400颗卫星,包围中国空间站,这是要做啥

素衣读史
2026-01-17 18:35:57
患癌早有预料!74岁聂卫平生前习惯被扒,烟酒成瘾只是冰山一角

患癌早有预料!74岁聂卫平生前习惯被扒,烟酒成瘾只是冰山一角

哄动一时啊
2026-01-17 20:00:32
“世界变了”,加拿大总理卡尼访华时的这番话耐人寻味

“世界变了”,加拿大总理卡尼访华时的这番话耐人寻味

上观新闻
2026-01-17 17:17:15
谁能拒绝年轻貌美又洋气的李一桐!这身材比例真的绝了

谁能拒绝年轻貌美又洋气的李一桐!这身材比例真的绝了

枫尘余往逝
2026-01-17 15:50:47
欠薪千万、关店100家!昔日家居龙头的体面,终究是碎了一地

欠薪千万、关店100家!昔日家居龙头的体面,终究是碎了一地

品牌观察官
2026-01-17 18:06:29
美国这次蒙了,最近美国大量囤积了铜,把铜价炒上天去了

美国这次蒙了,最近美国大量囤积了铜,把铜价炒上天去了

百态人间
2026-01-17 16:07:35
德甲犟驴!莱比锡被揍0-6仍与拜仁打对轰:这次1-5崩盘 渣叔傻眼

德甲犟驴!莱比锡被揍0-6仍与拜仁打对轰:这次1-5崩盘 渣叔傻眼

风过乡
2026-01-18 06:52:55
日本人气球星高桥蓝因与女优河北彩伽爆绯闻,远走波超卢布林

日本人气球星高桥蓝因与女优河北彩伽爆绯闻,远走波超卢布林

排球大视界
2026-01-17 20:22:57
2026-01-18 16:16:49
人工智能学家 incentive-icons
人工智能学家
人工智能领域权威媒体
4482文章数 37393关注度
往期回顾 全部

科技要闻

AI大事!马斯克:索赔9300亿元

头条要闻

特朗普向各国开价:"和平委员会"永久席位 10亿美元

头条要闻

特朗普向各国开价:"和平委员会"永久席位 10亿美元

体育要闻

21年后,中国男足重返亚洲四强

娱乐要闻

43岁贾玲退出春晚、解散公司

财经要闻

BBA,势败如山倒

汽车要闻

林肯贾鸣镝:稳中求进,将精细化运营进行到底

态度原创

手机
房产
旅游
家居
本地

手机要闻

Air史上最大电池!红魔11 Air官宣搭载7000mAh牛魔王电池

房产要闻

真四代来了!这次,海口楼市将彻底颠覆!

旅游要闻

参观青岛档案馆,了解青岛历史

家居要闻

岁月柔情 现代品质轻奢

本地新闻

云游内蒙|黄沙与碧波撞色,乌海天生会“混搭”

无障碍浏览 进入关怀版