网易首页 > 网易号 > 正文 申请入驻

极佳科技黄冠:为通用具身智能打造数据引擎,商业化落地速度国内最快丨GenAICon 2024

0
分享至


智东西
作者 GenAICon 2024

2024中国生成式AI大会于4月18-19日在北京举行,在大会第二天的主会场AIGC应用专场上,极佳科技创始人&CEO黄冠博士以《技术与应用闭环,从视频生成走向世界模型》为题发表演讲。

黄冠认为,当下所有“通用智能”都在走向“端到端大模型”,一切问题都变成了“高质量数据”问题“世界模型”是未来具身智能最重要的“高质量数据”来源,它结合互联网数据、仿真数据、遥操数据、真实采集数据等多种数据,学习、训练、组合,从而得到交互式物理世界模拟器。

极佳科技正基于世界模型打造新一代数据平台,面向端到端自动驾驶和通用机器人提供服务。极佳科技DriveDreamer自动驾驶世界模型、WorldDreamer通用世界模型目前已成功商业化落地

以下为黄冠的演讲实录:

今天我主要跟大家汇报讨论一下我们在视频生成、世界模型方面相关的思考和进展,以及主要想分享一下我们对于打造通用具身智能新一代数据引擎的想法。

我们总结了通用智能目前大的发展趋势,整个行业在从以GPT和Sora为代表的通用内容智能,走向通用行动智能。无论是Agent、自动驾驶还是机器人,其核心是从产生内容到产生行动。当大模型能可靠地产生行动,那么对整个经济和社会的影响肯定是更大范围的,才是大家所谓的走向真正的“第四次工业革命”。

一、世界模型发展三大方向:视频生成、自动驾驶、通用机器人

世界模型这个词一开始是杨立昆提出的,他说GPT不能达到AGI,我们需要世界模型。其实这两年国内外,大家越来越认识到世界模型的重要性,核心是分三个方向在发展,包括视频生成、自动驾驶和通用机器人,都非常关注世界模型的进展。


首先是视频生成。今年年初Sora引爆整个AI圈子,值得注意的是OpenAI并没有把Sora看成一个单纯的文生视频模型,而是把它叫做World Simulator(世界模拟器),这就有了世界模型的雏形。去年下半年Runway也公开宣布说他们要走向通用世界模型。

我们也有一个工作叫WorldDreamer,应该是全球比较领先的用Transformer新一代架构,不是Diffusion架构,去走向通用视频生成和世界模型。


其次我们看到自动驾驶这个行业。既然是世界模型,一定会影响物理世界,会对物理世界有极强的理解和预测能力。

所以我们看到特斯拉从去年年中开始说他们在做General World Model(通用世界模型),同时特斯拉不断在视频基础模型这个方向加大投入。还有Wayve是一家英国的自动驾驶公司,这是比尔·盖茨在投了OpenAI之后,立马就去英国投的一家公司,因为比尔·盖茨觉得Wayve让他看到了物理世界AGI的希望。

极佳科技也是国内最早开始做自动驾驶世界模型的公司,我们的模型叫DriveDreamer,目前已经实现了大规模的商业落地应用。

更大的趋势,大家看到现在在通用机器人方向,伯克利、Covariant做了一系列跟世界模拟器、世界模型相关的工作,包括他们最近发的RFM机器人大模型相关工作。谷歌也在做可交互式的世界模型,人形机器人创企1X也通过世界模型预测未来、实现通用机器人。

全球世界模型跟视频生成、自动驾驶、通用机器人行业结合起来,正在非常快速发展。

二、通用智能走向端到端大模型,世界模型是最重要的高质量数据来源

目前的趋势是,所有通用智能都在走向端到端大模型,无论是生成式智能,包括语言、视频、图像、3D等的理解和生成;还是具身智能,包括自动驾驶、通用机器人等。

特别是自动驾驶,大家看到最近马斯克频频给特斯拉V12造势,它是标准的Video-in Action-out(视频输入-动作输出)系统。通用机器人也是最新的硅谷趋势,大家都在走向端到端、Video-in Action-out这样一个范式。

在这个趋势下,一切问题就变成了高质量数据的问题,因为这已经不再是过去规则驱动的系统了,需要高质量端到端的数据去迭代,去训练这样生成式智能或具身智能的系统。

我们认为,世界模型是未来具身智能最重要的高质量数据来源。现在大家看到有很多种解决数据问题的方式,包括从互联网的图像、视频数据去学习,还有用仿真数据去学习,或者像斯坦福通过ALOHA机器人等遥操设备去做端到端学习,自动驾驶或机器人通过真实采集的数据去学习。

行业里大家首先通过各种仿真的方式去解决Sim2Real的问题,以及通过更大规模的部署,解决更多真实数据来源的问题。

所以我们认为未来的数据来源一定会走向世界模型,它会结合上面所有数据去学习训练组合,得到交互式的物理世界模拟器

三、基于世界模型打造新一代数据平台,商业化落地速度国内最快

我们目前在做的事情,就是基于世界模型打造新一代的数据平台,面向端到端自动驾驶和通用机器人。平台底层是一个以视频生成和世界模型为核心的基础模型。大家知道Sora目前是不可用的,无论是成本还是速度,我们会追求速度和成本达到数量级的降低。

同时我们会有完备的平台服务,通过数据方式去服务端到端通用自动驾驶,以及通用机器人的通用操作、通用移动等相关场景,助力具身智能行业爆发。

极佳科技目前在自动驾驶世界模型上,相关技术是全球最领先的之一,同时我们商业化速度也是全球最快的。我们和国内很多主流的头部主机厂已经开始实际的商业合作,通过世界模型,用于数据生成、闭环仿真等相关方向。


同时,更具想象力和价值的场景,是我们面向通用机器人的世界模型和物理世界模拟器,这个方向我们的技术目前在国内也是比较领先的,同时我们商业化落地速度也是国内最快的。

其核心跟驾驶一样,首先它可以作为一个模拟器在通用机器人的数据生成、闭环仿真方面有重要的作用,同时后面也可以作为方案一部分,走向机器人的端到端方案。这个范式跟过去的自动驾驶和机器人分模块范式很不一样,会走向大一统的面向通用具身智能的端到端整体架构


以上是黄冠演讲内容的完整整理。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
将近40岁满脸褶,却尬演18岁少女,是谁给了她“强行装嫩”的勇气

将近40岁满脸褶,却尬演18岁少女,是谁给了她“强行装嫩”的勇气

娱乐圈十三太保
2024-05-28 13:56:53
这是极品中的极品吗?明星就是漂亮,上镜都不如真人好看。

这是极品中的极品吗?明星就是漂亮,上镜都不如真人好看。

小米虫侃人物
2024-06-03 08:39:23
午评:大盘小盘一起跌, A股今天太难了。但老手说止跌希望还在

午评:大盘小盘一起跌, A股今天太难了。但老手说止跌希望还在

牛奶小草莓的
2024-06-03 11:50:39
笑不活了,庆余年徐志胜终于出现了,我却笑死在网友评论区里

笑不活了,庆余年徐志胜终于出现了,我却笑死在网友评论区里

娱乐八卦木木子
2024-06-01 19:30:25
31岁章泽天生娃后遗症显现,儿童节晒照中,发缝变宽头发花白!

31岁章泽天生娃后遗症显现,儿童节晒照中,发缝变宽头发花白!

鑫鑫说说
2024-06-03 11:52:42
乌军疑似发起哈尔科夫反击!装甲纵队全灭,俄军5月损失创新高

乌军疑似发起哈尔科夫反击!装甲纵队全灭,俄军5月损失创新高

鹰眼Defence
2024-06-02 17:21:56
观众骤减,百年日内瓦车展黯然停办

观众骤减,百年日内瓦车展黯然停办

环球时报国际
2024-06-03 06:52:58
你把汉堡王藏哪去了阿扎尔晒照骑自行车,这造型你认得出吗?

你把汉堡王藏哪去了阿扎尔晒照骑自行车,这造型你认得出吗?

直播吧
2024-06-02 16:56:08
艾弗森:我的掘金队友跟怪物一样 只是不巧碰到了巅峰马刺和湖人

艾弗森:我的掘金队友跟怪物一样 只是不巧碰到了巅峰马刺和湖人

直播吧
2024-06-02 23:09:11
93岁默多克结婚啦!67岁新娘穿白裙笑容甜,新郎看妻子眼神爱意浓

93岁默多克结婚啦!67岁新娘穿白裙笑容甜,新郎看妻子眼神爱意浓

八八尚语
2024-06-02 22:12:01
真是狠人!英国“酒仙夫妇”站票到新疆,32小时绿皮火车累到崩溃

真是狠人!英国“酒仙夫妇”站票到新疆,32小时绿皮火车累到崩溃

鬼谷子思维
2024-06-03 14:26:22
严查!领着万元退休金,整天“一条龙”吃喝玩乐的老年人其心可诛

严查!领着万元退休金,整天“一条龙”吃喝玩乐的老年人其心可诛

娱乐的硬糖吖
2024-06-03 11:42:36
为他人提供手淫,构成卖淫吗

为他人提供手淫,构成卖淫吗

刑事黎律
2024-05-30 07:00:08
现今周劼这样的傻冒,已经不多了

现今周劼这样的傻冒,已经不多了

吃货的分享
2024-06-02 19:20:03
一年回收1亿吨,美国为何大量回收我国废弃的混凝土?

一年回收1亿吨,美国为何大量回收我国废弃的混凝土?

可可可乐乐
2024-06-03 13:02:18
刘德华女儿高调亮相,太漂亮了,恐怕是娱乐圈颜值最高的星二代了

刘德华女儿高调亮相,太漂亮了,恐怕是娱乐圈颜值最高的星二代了

阿芒娱乐说
2024-06-02 22:43:49
张雨绮在国外终于放开!穿抹胸踩20cm高跟走戛纳,身材不输卡戴珊

张雨绮在国外终于放开!穿抹胸踩20cm高跟走戛纳,身材不输卡戴珊

宋若时尚搭
2024-06-02 15:25:55
蔡斌为何雪藏朱婷?央视解说给出的分析你赞同吗,惠若琪一针见血

蔡斌为何雪藏朱婷?央视解说给出的分析你赞同吗,惠若琪一针见血

何老师呀
2024-06-02 22:16:34
顾烜爷爷发声,她从嘉峪关离职原因曝光,原来她是一个乖乖女

顾烜爷爷发声,她从嘉峪关离职原因曝光,原来她是一个乖乖女

平老师666
2024-06-02 21:20:07
库兹马转发20年詹姆斯单打小里弗斯误被球砸旧闻:这也太TM好笑了

库兹马转发20年詹姆斯单打小里弗斯误被球砸旧闻:这也太TM好笑了

法制社会报
2024-06-03 10:16:09
2024-06-03 15:34:44
智东西
智东西
聚焦智能变革,服务产业升级。
8588文章数 116483关注度
往期回顾 全部

科技要闻

2万字演讲|黄仁勋剧透 未来3年新品有这些

头条要闻

陈冰:特朗普获罪令拜登更着急 他对拜登威胁性加大

头条要闻

陈冰:特朗普获罪令拜登更着急 他对拜登威胁性加大

体育要闻

万人空巷!皇马举行欧冠夺冠庆典

娱乐要闻

混战升级!编剧赵冬苓力挺王阳遭围攻

财经要闻

黄仁勋的计划:新AI平台 HBM4 机器人

汽车要闻

搭载华为HiCAR 传祺M6 MAX售14.58万元

态度原创

时尚
健康
教育
旅游
本地

夏季穿衣就看看日杂,不管衬衫还是t恤都太美了,时髦优雅

晚餐不吃or吃七分饱,哪种更减肥?

教育要闻

回归教材溯源本质 复盘教材梳理知识结构

旅游要闻

哈尔滨至香港航线正式开通

本地新闻

食味印象|歙县限定!枇杷味儿的清甜初夏

无障碍浏览 进入关怀版