网易首页 > 网易号 > 正文 申请入驻

PRO | MLLM:下一代自动驾驶的新解法

0
分享至

2023 年,几乎 AI 的每个领域都在以前所未有的速度进化,同时,AI 也在不断地推动着具身智能、自动驾驶等关键赛道的技术边界。
多模态趋势下,Transformer 作为 AI 大模型主流架构的局面是否会撼动?为何探索基于 MoE (专家混合)架构的大模型成为业内新趋势?大型视觉模型 (LVM)能否成为通用视觉的新突破?...
我们从过去的半年发布的 2023 年机器之心 PRO 会员通讯中,挑选了 10 份针对以上领域技术趋势、产业变革进行深入剖析的专题解读,助您在新的一年里为大展宏图做好准备。

本篇解读来自2023年 Week52 业内通讯

专题解读 MLLM:下一代自动驾驶的新解法

日期:12 月 16 日

事件:腾讯地图、普渡大学等机构的研究者发布了关于多模态大型语言模型(MLLM)在自动驾驶中应用的综述论文。LLM 技术整合到自动驾驶领域,在驾驶感知、运动规划、人车交互和运动控制方面将带来显著的范式转变。

大模型技术在自动驾驶领域应用的历程回顾

1、自动驾驶类似于经验丰富的人类驾驶员所拥有的能力。而获取这种熟练程度主要有两种:一是通过模拟环境中的基于学习的技术;二是通过类似的方法从离线数据中学习。由于模拟与现实世界之间的差异,这两个领域并不完全相同,即存在「sim2real」差距。

2、自动驾驶的目标是通过大量数据收集和深度学习,解决驾驶能力的局限性。然而,由于数据收集和注释的高成本,以及模拟环境和现实世界环境之间的固有差异。在这种情况下,通过有效地利用大语言模型中内嵌的天生常识,可能会逐渐缩小这一差距。逐步增强自动驾驶系统的能力,使其更接近或可能达到理想的专家级驾驶熟练度。

图:LLMs 在自动驾驶领域的应用

3、LLMs 在自动驾驶中的结合应用:

① 规划与控制层面:LLMs 在自动驾驶决策过程中的应用,特别是在提供透明解释和增强系统可靠性方面;研究分为两类:一是对预训练模型的微调,二是通过巧妙的提示设计来挖掘 LLMs 的深层推理潜力;相关应用案例如 MTD-GPT、DriveGPT4、GPT-Driver 等,均在不同的驾驶决策任务中展现出优越性能。

② 感知层面:业界目前主要是在感知领域使用大模型,LLMs 在自动驾驶感知任务中的具有独特的价值和强大能力;典型工作如 PromptTrack、HiLM-D,将 LLMs 与 3D 检测任务和跟踪任务结合,性能优越。

③ 问答和生成层面:相关研究包括 Domain Knowledge Distillation、Human-Centric Autonomous Systems 等,利用 LLMs 处理自动驾驶相关的复杂问题。

4、视觉-语言模型(VLMs)在自动驾驶领域也有了越来越多的尝试。通过集成语言数据,车辆和交通系统能够更深入地理解现实世界环境,提高驾驶安全性和效率。今年 9 月,伦敦的自动驾驶 Wayve 提出了基于视觉-语言-动作模型(VLAM)开发的自动驾驶交互模型 LINGO-1,LINGO-1 基于各种视觉和语言数据源上训练所得,能够执行视觉问答(VQA)任务,并且能对驾驶行为和推理进行描述。VLAM 是 Wayve 在视觉语言模型(VLM)基础上的进一步探索。

5、近期,多模态大型语言模型(MLLMs)成为研究热点。MLLMs 结合了如 ChatGPT、InstructGPT 等大型语言模型的能力,能够处理文本和图像等多种模态的任务。MLLMs 的关键技术和应用包括多模态指令调整、多模态上下文学习、多模态思维链,以及 LLM 辅助视觉推理等。相比于 LLMs,MLLMs 更符合人类的感知方式,能提供更友好的界面和更广泛的任务支持。

自动驾驶是「具身智能」 重要落地场景

1、具身智能的概念翻译于英文 embodied AI,字面意思为具有身体的人工智能。该概念的起源最早可追溯到 1950 年人工智能源点级人物艾伦·图灵的理论设想。

2、具身智能「大脑」包括算法驱动、基于 VLM(Visual-Language Model)理解信息等特点,具身智能「大脑」的决策感知体系和人类相似,都是基于图片转文本,再 Token 化理解。

3、自动驾驶是「具身智能」 重要落地场景之一。具身智能机器人「大脑」在一定程度上和自动驾驶相似,在开放场景和路径规划上具有一定的迁移性。同时,具身智能机器人和自动驾驶的技术在算法层面也是相通的。

4、近期...

MLLMs 如何「加持」自动驾驶?

1、感知方面

以 MLLMs 在自动驾驶的感知方面扮演着关键角色。通过结合视觉、文本和其他模态的数据,MLLMs 能够更全面地理解和解释周围环境。这种多模态融合不仅提高了对交通场景的理解能力,还增强了系统对新情况的适应性。例如...

2、规划和控制方面

在规划和控制方面,MLLMs 利用自然语言处理技术,将复杂的驾驶任务转化为更易于理解和执行的语言模型问题。这种方法不仅简化了任务的处理过程,还提高了任务执行的准确性和效率。例如...

3、安全性和可解释性方面

①MLLMs 在提高自动驾驶系统的安全性和可解释性方面发挥着重要作用。通过生成与计划动作相关的解释,MLLMs 提供了对决策过程的深入理解,从而增加了用户对系统的信任...

4、控制器参数微调

MLLMs 在自动驾驶中还有助于控制器参数的微调,使其更符合驾驶员的偏好。这种个性化的适应性不仅提升了驾驶体验,还增强了系统的灵活性和响应能力。例如...

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
25亿王者级肉签公布中签结果,号码有56.43万个,阳光普照奖

25亿王者级肉签公布中签结果,号码有56.43万个,阳光普照奖

数据挖掘分析
2026-06-29 09:23:08
外媒:中国台湾地区部署美制M1A2T坦克,首次进行大规模战备演练

外媒:中国台湾地区部署美制M1A2T坦克,首次进行大规模战备演练

零度Military
2026-06-28 20:57:36
韩红基金会被扒多次对外投资,几个亿善款闲置,网友要求公开说明

韩红基金会被扒多次对外投资,几个亿善款闲置,网友要求公开说明

萌神木木
2026-06-29 18:33:42
换掉阿汤哥的《侠探杰克》,反而成了全球爆款

换掉阿汤哥的《侠探杰克》,反而成了全球爆款

生活观察员啊
2026-06-29 00:59:39
20岁科特迪瓦中场新星闪耀世界杯 身价涨到4000万欧 5大豪强疯抢

20岁科特迪瓦中场新星闪耀世界杯 身价涨到4000万欧 5大豪强疯抢

零度眼看球
2026-06-29 09:23:59
WTT美国大满贯:16强对阵出炉!国乒占2席,国乒跨国组合0:3出局

WTT美国大满贯:16强对阵出炉!国乒占2席,国乒跨国组合0:3出局

国乒二三事
2026-06-29 14:38:36
界面调查|“断骨增高”灰产链:每拉一人提成1.5万元,医托们曾是受术者

界面调查|“断骨增高”灰产链:每拉一人提成1.5万元,医托们曾是受术者

界面新闻
2026-06-29 13:54:42
热浪侵袭欧洲多国 多地接连刷新6月高温历史纪录

热浪侵袭欧洲多国 多地接连刷新6月高温历史纪录

中国经济网
2026-06-29 15:14:13
⚽ 日本vs巴西:桑巴军团教蓝武士做人,2-0稳了

⚽ 日本vs巴西:桑巴军团教蓝武士做人,2-0稳了

生活新鲜市
2026-06-29 17:39:59
送水工一天挣1000,活款几百万上海两套房!媒体:努力干你也有

送水工一天挣1000,活款几百万上海两套房!媒体:努力干你也有

走读新生
2026-06-29 13:06:14
耿同学不是学术法官,高校没理由配合他的流量表演

耿同学不是学术法官,高校没理由配合他的流量表演

金哥说新能源车
2026-06-29 19:14:59
火药味十足!森保一态度强硬,放话夺冠,安帅不敢轻敌,点名小将

火药味十足!森保一态度强硬,放话夺冠,安帅不敢轻敌,点名小将

萌兰聊个球
2026-06-29 09:35:26
贝克汉姆14岁的女儿小七怎么如此成熟了,好像少妇

贝克汉姆14岁的女儿小七怎么如此成熟了,好像少妇

西楼知趣杂谈
2026-06-13 19:52:21
2分钟内就相撞!东沙爆发对峙,海巡署舰开足马力冲向大陆海警船

2分钟内就相撞!东沙爆发对峙,海巡署舰开足马力冲向大陆海警船

阿龙聊军事
2026-06-28 08:23:30
9 月 9 日苹果发布会敲定!iPhone 18 Pro和Ultra 登场

9 月 9 日苹果发布会敲定!iPhone 18 Pro和Ultra 登场

巴士数码
2026-06-29 21:44:48
俄乌局势逆转,俄罗斯犯下严重战略错误!

俄乌局势逆转,俄罗斯犯下严重战略错误!

一个坏土豆
2026-06-28 19:14:03
基本上可以确定,只要伊朗轰炸美国本土,伊朗战争就会立刻结束

基本上可以确定,只要伊朗轰炸美国本土,伊朗战争就会立刻结束

揭秘历史的真相
2026-06-14 20:35:29
中国女排吴梦洁 更新康复进度

中国女排吴梦洁 更新康复进度

动物奇奇怪怪
2026-06-30 00:23:34
飞机偶遇58岁杨澜,商务舱读书做笔记,知性状态惊艳全网

飞机偶遇58岁杨澜,商务舱读书做笔记,知性状态惊艳全网

奇怪的鲨鱼们
2026-06-29 12:02:29
小组赛搭乘私人飞机27次,国际足联主席因凡蒂诺遭批;创造了队史世界杯上的最差成绩,韩国主帅洪明甫下课

小组赛搭乘私人飞机27次,国际足联主席因凡蒂诺遭批;创造了队史世界杯上的最差成绩,韩国主帅洪明甫下课

大风新闻
2026-06-29 08:33:04
2026-06-30 02:44:49
机器之心Pro incentive-icons
机器之心Pro
专业的人工智能媒体
13390文章数 142684关注度
往期回顾 全部

科技要闻

杀疯了!深圳一天出两家200亿具身智能公司

头条要闻

美从俄乌战场抽身 金灿荣:美国有个大战略目标已完成

头条要闻

美从俄乌战场抽身 金灿荣:美国有个大战略目标已完成

体育要闻

他和伊朗队,再次赢得全世界的尊重

娱乐要闻

跟风电影《给阿公的牛肉丸》开机

财经要闻

万达广场批量易主 多位投资人正式入局

汽车要闻

全新宝马iX3长轴版将于成都车展预售 四季度交付

态度原创

教育
时尚
本地
家居
健康

教育要闻

农村女孩高考699分,接到清华电话!

好特别的白色造型,太高级了

本地新闻

贵州小城的新目标:举办“村超”世界杯!

家居要闻

传奇筑 日常诗

狂吃“糯叽叽”小心肠梗阻!

无障碍浏览 进入关怀版