网易首页 > 网易号 > 正文 申请入驻

极佳科技黄冠:为通用具身智能打造数据引擎,商业化落地速度国内最快丨GenAICon 2024

0
分享至


智东西
作者 GenAICon 2024

2024中国生成式AI大会于4月18-19日在北京举行,在大会第二天的主会场AIGC应用专场上,极佳科技创始人&CEO黄冠博士以《技术与应用闭环,从视频生成走向世界模型》为题发表演讲。

黄冠认为,当下所有“通用智能”都在走向“端到端大模型”,一切问题都变成了“高质量数据”问题“世界模型”是未来具身智能最重要的“高质量数据”来源,它结合互联网数据、仿真数据、遥操数据、真实采集数据等多种数据,学习、训练、组合,从而得到交互式物理世界模拟器。

极佳科技正基于世界模型打造新一代数据平台,面向端到端自动驾驶和通用机器人提供服务。极佳科技DriveDreamer自动驾驶世界模型、WorldDreamer通用世界模型目前已成功商业化落地

以下为黄冠的演讲实录:

今天我主要跟大家汇报讨论一下我们在视频生成、世界模型方面相关的思考和进展,以及主要想分享一下我们对于打造通用具身智能新一代数据引擎的想法。

我们总结了通用智能目前大的发展趋势,整个行业在从以GPT和Sora为代表的通用内容智能,走向通用行动智能。无论是Agent、自动驾驶还是机器人,其核心是从产生内容到产生行动。当大模型能可靠地产生行动,那么对整个经济和社会的影响肯定是更大范围的,才是大家所谓的走向真正的“第四次工业革命”。

一、世界模型发展三大方向:视频生成、自动驾驶、通用机器人

世界模型这个词一开始是杨立昆提出的,他说GPT不能达到AGI,我们需要世界模型。其实这两年国内外,大家越来越认识到世界模型的重要性,核心是分三个方向在发展,包括视频生成、自动驾驶和通用机器人,都非常关注世界模型的进展。


首先是视频生成。今年年初Sora引爆整个AI圈子,值得注意的是OpenAI并没有把Sora看成一个单纯的文生视频模型,而是把它叫做World Simulator(世界模拟器),这就有了世界模型的雏形。去年下半年Runway也公开宣布说他们要走向通用世界模型。

我们也有一个工作叫WorldDreamer,应该是全球比较领先的用Transformer新一代架构,不是Diffusion架构,去走向通用视频生成和世界模型。


其次我们看到自动驾驶这个行业。既然是世界模型,一定会影响物理世界,会对物理世界有极强的理解和预测能力。

所以我们看到特斯拉从去年年中开始说他们在做General World Model(通用世界模型),同时特斯拉不断在视频基础模型这个方向加大投入。还有Wayve是一家英国的自动驾驶公司,这是比尔·盖茨在投了OpenAI之后,立马就去英国投的一家公司,因为比尔·盖茨觉得Wayve让他看到了物理世界AGI的希望。

极佳科技也是国内最早开始做自动驾驶世界模型的公司,我们的模型叫DriveDreamer,目前已经实现了大规模的商业落地应用。

更大的趋势,大家看到现在在通用机器人方向,伯克利、Covariant做了一系列跟世界模拟器、世界模型相关的工作,包括他们最近发的RFM机器人大模型相关工作。谷歌也在做可交互式的世界模型,人形机器人创企1X也通过世界模型预测未来、实现通用机器人。

全球世界模型跟视频生成、自动驾驶、通用机器人行业结合起来,正在非常快速发展。

二、通用智能走向端到端大模型,世界模型是最重要的高质量数据来源

目前的趋势是,所有通用智能都在走向端到端大模型,无论是生成式智能,包括语言、视频、图像、3D等的理解和生成;还是具身智能,包括自动驾驶、通用机器人等。

特别是自动驾驶,大家看到最近马斯克频频给特斯拉V12造势,它是标准的Video-in Action-out(视频输入-动作输出)系统。通用机器人也是最新的硅谷趋势,大家都在走向端到端、Video-in Action-out这样一个范式。

在这个趋势下,一切问题就变成了高质量数据的问题,因为这已经不再是过去规则驱动的系统了,需要高质量端到端的数据去迭代,去训练这样生成式智能或具身智能的系统。

我们认为,世界模型是未来具身智能最重要的高质量数据来源。现在大家看到有很多种解决数据问题的方式,包括从互联网的图像、视频数据去学习,还有用仿真数据去学习,或者像斯坦福通过ALOHA机器人等遥操设备去做端到端学习,自动驾驶或机器人通过真实采集的数据去学习。

行业里大家首先通过各种仿真的方式去解决Sim2Real的问题,以及通过更大规模的部署,解决更多真实数据来源的问题。

所以我们认为未来的数据来源一定会走向世界模型,它会结合上面所有数据去学习训练组合,得到交互式的物理世界模拟器

三、基于世界模型打造新一代数据平台,商业化落地速度国内最快

我们目前在做的事情,就是基于世界模型打造新一代的数据平台,面向端到端自动驾驶和通用机器人。平台底层是一个以视频生成和世界模型为核心的基础模型。大家知道Sora目前是不可用的,无论是成本还是速度,我们会追求速度和成本达到数量级的降低。

同时我们会有完备的平台服务,通过数据方式去服务端到端通用自动驾驶,以及通用机器人的通用操作、通用移动等相关场景,助力具身智能行业爆发。

极佳科技目前在自动驾驶世界模型上,相关技术是全球最领先的之一,同时我们商业化速度也是全球最快的。我们和国内很多主流的头部主机厂已经开始实际的商业合作,通过世界模型,用于数据生成、闭环仿真等相关方向。


同时,更具想象力和价值的场景,是我们面向通用机器人的世界模型和物理世界模拟器,这个方向我们的技术目前在国内也是比较领先的,同时我们商业化落地速度也是国内最快的。

其核心跟驾驶一样,首先它可以作为一个模拟器在通用机器人的数据生成、闭环仿真方面有重要的作用,同时后面也可以作为方案一部分,走向机器人的端到端方案。这个范式跟过去的自动驾驶和机器人分模块范式很不一样,会走向大一统的面向通用具身智能的端到端整体架构


以上是黄冠演讲内容的完整整理。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
等等党的胜利!32G内存价格爆跌30% 只因没人买

等等党的胜利!32G内存价格爆跌30% 只因没人买

3DM游戏
2026-04-02 11:50:05
65岁工地大爷:跳了半年交谊舞真的怕了,女人没有一个是省油的灯

65岁工地大爷:跳了半年交谊舞真的怕了,女人没有一个是省油的灯

施工员小天哥
2026-04-01 15:56:48
卫报评世界杯各队实力榜:法西阿前三,日本第八英格兰第十二

卫报评世界杯各队实力榜:法西阿前三,日本第八英格兰第十二

懂球帝
2026-04-02 05:49:07
武汉三镇外援绍尔携妻子泰国度假,休赛期尽享惬意时光

武汉三镇外援绍尔携妻子泰国度假,休赛期尽享惬意时光

懂球帝
2026-04-02 21:11:06
过分?姆巴佩替补登场前,令队友夺走坎特的队长袖标,后者很震惊

过分?姆巴佩替补登场前,令队友夺走坎特的队长袖标,后者很震惊

风过乡
2026-04-02 21:59:36
涉嫌严重违纪违法,泉州多人被查!

涉嫌严重违纪违法,泉州多人被查!

云上南安
2026-04-02 20:34:09
哈佛研究:让孩子“疯跑”,才是对大脑顶级的投资

哈佛研究:让孩子“疯跑”,才是对大脑顶级的投资

枕边聊育儿
2026-04-02 10:57:59
直播意外睡着反获十万打赏:真实才是流量密码

直播意外睡着反获十万打赏:真实才是流量密码

阿废冷眼观察所
2026-04-01 14:08:35
2099元!苹果刚发布的新品,售罄了

2099元!苹果刚发布的新品,售罄了

全是技能
2026-03-31 14:55:08
ChatGPT现已支持苹果CarPlay车载系统

ChatGPT现已支持苹果CarPlay车载系统

至顶AI实验室
2026-04-03 00:31:05
四川省纪委监委:2人严重违纪违法被处分

四川省纪委监委:2人严重违纪违法被处分

金台资讯
2026-04-02 16:53:32
中国股市:但凡第二天的涨停股,都逃不过这个规律,无一例外

中国股市:但凡第二天的涨停股,都逃不过这个规律,无一例外

股经纵横谈
2026-04-01 19:03:17
这才是地球禁区?30秒毁全身细胞,剧毒万年不散

这才是地球禁区?30秒毁全身细胞,剧毒万年不散

心中的麦田
2026-04-02 19:36:12
4月5日清明,提醒中老年人:1不穿、2不吃、3要忌、4要做,别犯忌

4月5日清明,提醒中老年人:1不穿、2不吃、3要忌、4要做,别犯忌

江江食研社
2026-03-31 21:50:03
苏州富二代网恋俄罗斯美女,对方小他7岁,见面3天就领证结婚

苏州富二代网恋俄罗斯美女,对方小他7岁,见面3天就领证结婚

圆梦的小老头
2026-03-22 08:40:50
摩尔多瓦议会批准退出俄罗斯主导的独联体

摩尔多瓦议会批准退出俄罗斯主导的独联体

桂系007
2026-04-02 23:38:16
一夜变天!伊朗怂了?不到24小时,伊朗总统表态:愿意结束战争

一夜变天!伊朗怂了?不到24小时,伊朗总统表态:愿意结束战争

快乐彼岸
2026-04-02 23:48:20
她的三任丈夫,一个县委书记,一个省委书记,一个副总理

她的三任丈夫,一个县委书记,一个省委书记,一个副总理

霹雳炮
2026-04-01 23:11:39
1967年,梁兴初视察成都军区时,被流氓威胁:这条街,你们出不去

1967年,梁兴初视察成都军区时,被流氓威胁:这条街,你们出不去

大运河时空
2026-02-21 13:40:03
“这次穿得算保守了”,女老师短裙配蕾丝袜,学生上课头都不敢抬

“这次穿得算保守了”,女老师短裙配蕾丝袜,学生上课头都不敢抬

妍妍教育日记
2026-03-21 10:05:03
2026-04-03 01:48:49
智东西 incentive-icons
智东西
聚焦智能变革,服务产业升级。
11501文章数 117022关注度
往期回顾 全部

科技要闻

三年亏20亿,最新估值58亿,Xreal冲刺港股

头条要闻

视频:美新型导弹空爆数千枚弹片 炸死21名伊朗青少年

头条要闻

视频:美新型导弹空爆数千枚弹片 炸死21名伊朗青少年

体育要闻

邵佳一的改革,从让每个人踢舒服开始

娱乐要闻

《浪姐》人气榜出炉!曾沛慈断层第一

财经要闻

市场被特朗普一句话打醒 滞胀交易回归

汽车要闻

轴距2米7/后排能跷腿 试驾后驱小车QQ3 EV

态度原创

时尚
家居
数码
旅游
公开课

成熟女性衣服别越买越多,准备好衬衫和西装,得体大方又高级

家居要闻

岁月静好 典雅新章

数码要闻

跨界者大疆:不折腾才是扫地机的终极形态

旅游要闻

以花为媒,打造更多体验经济新场景

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版