网易首页 > 网易号 > 正文 申请入驻

极佳科技黄冠:为通用具身智能打造数据引擎,商业化落地速度国内最快丨GenAICon 2024

0
分享至


智东西
作者 GenAICon 2024

2024中国生成式AI大会于4月18-19日在北京举行,在大会第二天的主会场AIGC应用专场上,极佳科技创始人&CEO黄冠博士以《技术与应用闭环,从视频生成走向世界模型》为题发表演讲。

黄冠认为,当下所有“通用智能”都在走向“端到端大模型”,一切问题都变成了“高质量数据”问题“世界模型”是未来具身智能最重要的“高质量数据”来源,它结合互联网数据、仿真数据、遥操数据、真实采集数据等多种数据,学习、训练、组合,从而得到交互式物理世界模拟器。

极佳科技正基于世界模型打造新一代数据平台,面向端到端自动驾驶和通用机器人提供服务。极佳科技DriveDreamer自动驾驶世界模型、WorldDreamer通用世界模型目前已成功商业化落地

以下为黄冠的演讲实录:

今天我主要跟大家汇报讨论一下我们在视频生成、世界模型方面相关的思考和进展,以及主要想分享一下我们对于打造通用具身智能新一代数据引擎的想法。

我们总结了通用智能目前大的发展趋势,整个行业在从以GPT和Sora为代表的通用内容智能,走向通用行动智能。无论是Agent、自动驾驶还是机器人,其核心是从产生内容到产生行动。当大模型能可靠地产生行动,那么对整个经济和社会的影响肯定是更大范围的,才是大家所谓的走向真正的“第四次工业革命”。

一、世界模型发展三大方向:视频生成、自动驾驶、通用机器人

世界模型这个词一开始是杨立昆提出的,他说GPT不能达到AGI,我们需要世界模型。其实这两年国内外,大家越来越认识到世界模型的重要性,核心是分三个方向在发展,包括视频生成、自动驾驶和通用机器人,都非常关注世界模型的进展。


首先是视频生成。今年年初Sora引爆整个AI圈子,值得注意的是OpenAI并没有把Sora看成一个单纯的文生视频模型,而是把它叫做World Simulator(世界模拟器),这就有了世界模型的雏形。去年下半年Runway也公开宣布说他们要走向通用世界模型。

我们也有一个工作叫WorldDreamer,应该是全球比较领先的用Transformer新一代架构,不是Diffusion架构,去走向通用视频生成和世界模型。


其次我们看到自动驾驶这个行业。既然是世界模型,一定会影响物理世界,会对物理世界有极强的理解和预测能力。

所以我们看到特斯拉从去年年中开始说他们在做General World Model(通用世界模型),同时特斯拉不断在视频基础模型这个方向加大投入。还有Wayve是一家英国的自动驾驶公司,这是比尔·盖茨在投了OpenAI之后,立马就去英国投的一家公司,因为比尔·盖茨觉得Wayve让他看到了物理世界AGI的希望。

极佳科技也是国内最早开始做自动驾驶世界模型的公司,我们的模型叫DriveDreamer,目前已经实现了大规模的商业落地应用。

更大的趋势,大家看到现在在通用机器人方向,伯克利、Covariant做了一系列跟世界模拟器、世界模型相关的工作,包括他们最近发的RFM机器人大模型相关工作。谷歌也在做可交互式的世界模型,人形机器人创企1X也通过世界模型预测未来、实现通用机器人。

全球世界模型跟视频生成、自动驾驶、通用机器人行业结合起来,正在非常快速发展。

二、通用智能走向端到端大模型,世界模型是最重要的高质量数据来源

目前的趋势是,所有通用智能都在走向端到端大模型,无论是生成式智能,包括语言、视频、图像、3D等的理解和生成;还是具身智能,包括自动驾驶、通用机器人等。

特别是自动驾驶,大家看到最近马斯克频频给特斯拉V12造势,它是标准的Video-in Action-out(视频输入-动作输出)系统。通用机器人也是最新的硅谷趋势,大家都在走向端到端、Video-in Action-out这样一个范式。

在这个趋势下,一切问题就变成了高质量数据的问题,因为这已经不再是过去规则驱动的系统了,需要高质量端到端的数据去迭代,去训练这样生成式智能或具身智能的系统。

我们认为,世界模型是未来具身智能最重要的高质量数据来源。现在大家看到有很多种解决数据问题的方式,包括从互联网的图像、视频数据去学习,还有用仿真数据去学习,或者像斯坦福通过ALOHA机器人等遥操设备去做端到端学习,自动驾驶或机器人通过真实采集的数据去学习。

行业里大家首先通过各种仿真的方式去解决Sim2Real的问题,以及通过更大规模的部署,解决更多真实数据来源的问题。

所以我们认为未来的数据来源一定会走向世界模型,它会结合上面所有数据去学习训练组合,得到交互式的物理世界模拟器

三、基于世界模型打造新一代数据平台,商业化落地速度国内最快

我们目前在做的事情,就是基于世界模型打造新一代的数据平台,面向端到端自动驾驶和通用机器人。平台底层是一个以视频生成和世界模型为核心的基础模型。大家知道Sora目前是不可用的,无论是成本还是速度,我们会追求速度和成本达到数量级的降低。

同时我们会有完备的平台服务,通过数据方式去服务端到端通用自动驾驶,以及通用机器人的通用操作、通用移动等相关场景,助力具身智能行业爆发。

极佳科技目前在自动驾驶世界模型上,相关技术是全球最领先的之一,同时我们商业化速度也是全球最快的。我们和国内很多主流的头部主机厂已经开始实际的商业合作,通过世界模型,用于数据生成、闭环仿真等相关方向。


同时,更具想象力和价值的场景,是我们面向通用机器人的世界模型和物理世界模拟器,这个方向我们的技术目前在国内也是比较领先的,同时我们商业化落地速度也是国内最快的。

其核心跟驾驶一样,首先它可以作为一个模拟器在通用机器人的数据生成、闭环仿真方面有重要的作用,同时后面也可以作为方案一部分,走向机器人的端到端方案。这个范式跟过去的自动驾驶和机器人分模块范式很不一样,会走向大一统的面向通用具身智能的端到端整体架构


以上是黄冠演讲内容的完整整理。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
利率维持不变,全球都失望了!我们的胜利在哪里?

利率维持不变,全球都失望了!我们的胜利在哪里?

云姐财说
2024-06-18 08:13:23
事情闹大了!这次南方医科大有麻烦

事情闹大了!这次南方医科大有麻烦

糖逗在娱乐
2024-06-18 06:04:12
带娃尴尬时刻:孩子一起玩但家长却不能一起玩!家长:谁来救救我

带娃尴尬时刻:孩子一起玩但家长却不能一起玩!家长:谁来救救我

滑稽斑马呀
2024-06-17 15:58:14
看完4集《金庸武侠世界》,我想说:武侠剧像这么拍,何愁没观众

看完4集《金庸武侠世界》,我想说:武侠剧像这么拍,何愁没观众

肥罗大电影
2024-06-17 20:08:42
有些孩子不爱在家吃饭是有原因的!评论区的每一道菜都让我震惊

有些孩子不爱在家吃饭是有原因的!评论区的每一道菜都让我震惊

吃货的分享
2024-06-17 08:49:42
国足迎来意外之喜!亚足联再送大礼,或直接避开日本韩国

国足迎来意外之喜!亚足联再送大礼,或直接避开日本韩国

十点体坛
2024-06-17 15:51:35
终于登船临检了!中国海警强势驱离菲船,菲海警竟说自己没参与

终于登船临检了!中国海警强势驱离菲船,菲海警竟说自己没参与

战域笔墨
2024-06-17 21:00:05
曼联欲清洗五人节省8300万工资!谈判重点曝光,一事比转会费关键

曼联欲清洗五人节省8300万工资!谈判重点曝光,一事比转会费关键

罗米的曼联博客
2024-06-17 08:40:39
你见过哪些因玩笑引发的血案?网友:儿子大婚,公公第二天上吊了

你见过哪些因玩笑引发的血案?网友:儿子大婚,公公第二天上吊了

有趣的羊驼
2024-06-17 16:41:14
北约威胁:中国再支持俄罗斯,要付出“经济代价”

北约威胁:中国再支持俄罗斯,要付出“经济代价”

观察者网
2024-06-18 09:06:20
继比尔盖茨后、美知名经济学家给出预测:断供中国芯片最多10年

继比尔盖茨后、美知名经济学家给出预测:断供中国芯片最多10年

科技龙
2024-06-17 10:06:56
董必武同毛主席看戏,工作人员:前排是领导坐的,你坐后面

董必武同毛主席看戏,工作人员:前排是领导坐的,你坐后面

小新历史
2024-06-18 09:08:35
每次出场都像海报!胡歌《繁花》台湾播出空降冠军

每次出场都像海报!胡歌《繁花》台湾播出空降冠军

ETtoday星光云
2024-06-17 18:14:08
女生会接受一个性能力不好的男朋友吗?评论区的回答惊呆上万读者

女生会接受一个性能力不好的男朋友吗?评论区的回答惊呆上万读者

社会潜伏者
2024-05-13 01:15:15
最想赢的人,比利时两次进球德布劳内第一时间喊队友回去开球

最想赢的人,比利时两次进球德布劳内第一时间喊队友回去开球

懂球帝
2024-06-18 02:27:10
怪谁呢?英官员称因担心“中国造徽章可能植入跟踪装置”,英军新帽徽被推迟推出

怪谁呢?英官员称因担心“中国造徽章可能植入跟踪装置”,英军新帽徽被推迟推出

环球网资讯
2024-06-16 17:02:48
乌克兰大规模打击俄罗斯Su-34空军基地,俄罗斯防空系统有心无力

乌克兰大规模打击俄罗斯Su-34空军基地,俄罗斯防空系统有心无力

今观天下
2024-06-15 09:28:11
国足“恩人”桑尼空降中国捞金,全程笑嘻嘻,球迷:怪不得他能火

国足“恩人”桑尼空降中国捞金,全程笑嘻嘻,球迷:怪不得他能火

侧身凌空斩
2024-06-17 05:49:54
两女共侍一夫,华裔男子一起迎娶两位新娘,三人行婚礼现场曝光!

两女共侍一夫,华裔男子一起迎娶两位新娘,三人行婚礼现场曝光!

文雅笔墨
2024-06-16 22:40:56
合资反击!卡罗拉7.98万起!百公里油耗5L,选它还是自主新能源?

合资反击!卡罗拉7.98万起!百公里油耗5L,选它还是自主新能源?

Nice好车
2024-06-18 09:09:06
2024-06-18 09:48:49
智东西
智东西
聚焦智能变革,服务产业升级。
8614文章数 116489关注度
往期回顾 全部

科技要闻

低价“6·18”没有狂欢

头条要闻

牛弹琴:普京罕见访朝一箭三雕 中方回应四两拨千斤

头条要闻

牛弹琴:普京罕见访朝一箭三雕 中方回应四两拨千斤

体育要闻

24年后,他们终于又在欧洲杯赢球了

娱乐要闻

上影节红毯:倪妮好松弛,娜扎吸睛

财经要闻

广汽也想“掀桌子”了?

汽车要闻

传奇新篇章 全新一代大众迈腾来了

态度原创

亲子
本地
时尚
公开课
军事航空

亲子要闻

“你们老爷们儿都不去,让小女孩都看不起你们”,宝爸“PUA式”劝宝宝上幼儿园,求你了出一套对小女生的说辞吧。

本地新闻

能动司法尽“执”履责 ——“交叉执行”高效能

夏季流行单品西装短裤的N种穿法,你学会了吗

公开课

近视只是视力差?小心并发症

军事要闻

"局部战术暂停"后 以军袭击加沙地带多地

无障碍浏览 进入关怀版