网易首页 > 网易号 > 正文 申请入驻

清华首次提出数据驱动控制新形式,算法效率直翻三倍

0
分享至

iDLab团队 投稿
量子位 | 公众号 QbitAI

当大数据席卷各行各业,控制理论也迎来新的拐点:从依赖模型到依赖数据。

但是,在数据驱动控制领域,却缺乏一种标准化的数据表示形式

针对这一问题,清华大学李升波教授课题组(iDLab)首次将现代控制理论中的标准型概念引入数据驱动控制(datatic control)范式,提出了一种基于数据的系统描述新形式。

每个标准形式的样本由必要的转移和可插拔的属性组成,分别用于描述系统变化规律和人为定义特征。



不仅如此,该数据标准型还可根据算法需求定制属性,显著加速控制器设计,为提高数据驱动算法效率提供了新的思路。

目前,该成果已发表于ACC2025。

从模型标准型到数据标准型

人工智能的蓬勃发展,离不开数据这一核心支柱。

近年来,随着人工智能技术的广泛应用,以数据为核心的系统表征方法迅速渗透到控制领域。

控制系统的设计方法正迎来一场从模型驱动向数据驱动的范式变革,即从传统的模型驱动控制(modelic control,即model-driven control)到数据驱动控制(datatic control,即data-driven control)。



图1:两种控制范式对比

模型驱动控制(上方路径)首先利用系统辨识来拟合一个模型,然后用这个模型来合成控制器。

数据驱动控制(下方路径)则直接利用数据来求解控制器。

在模型驱动控制(modelic control)的范式下,模型的标准型是一个有力工具。

例如,现代控制理论的奠基人鲁道夫·卡尔曼(Rudolf E. Kálmán)指出:将状态空间模型表示为可控标准型或可观标准型,无需额外的判断步骤即可直接确保系统的可控性或可观性。

此外,现代群论的奠基人之一卡米耶·若尔当(Camille Jordan)指出:任何状态空间模型都可以转换为约旦标准型,系统矩阵会变为对角方阵,其对角线元素代表系统的特征值。

因此,只需检查所有特征值是否为负,即可轻松验证系统的稳定性。更进一步,不同的特征值对应着系统不同的模态,这使得控制器设计更具针对性。

数据驱动控制(datatic control)范式下的标准型是一个新问题。

近年来,随着机器人、自动驾驶等具身智能系统的蓬勃发展,海量、复杂的交互数据正以前所未有的速度被生成。这不仅为传统控制算法带来了巨大挑战,也引出了一个全新的议题:

在数据驱动控制范式下,如何构建一个有效利用大规模数据的标准描述方式?即是否存在数据驱动版本的标准型?

数据的描述形式直接决定了后续控制器设计算法的运行效率和可扩展性。

以强化学习为例,训练算法通常涉及大量的迭代计算和高维数据处理。

在这一过程中,算法很容易陷入重复计算的泥潭,例如在每一步训练迭代中,都重新计算样本间的范数距离、特征相似度等信息。

这种重复性的计算不仅耗时,而且对计算资源造成了显著的浪费,严重制约了算法在现实世界中的部署和应用。

因此,如何高效、标准地组织和描述数据,以减少冗余计算、加速算法运行,是数据驱动控制范式面临的一项核心挑战。

类比于模型标准型,该研究首次提出,适用于数据驱动控制系统的标准描述形式:每条样本数据包含两个部分(如图2所示):



图2:数据标准型示意图

(1)必要的转移部分

,即<当前状态

,当前动作



,下一状态



(2)可插拔的属性部分,例如奖励信号或其他人工设计特征。

前者蕴含了控制器设计必要的系统的动力学信息,后者可以根据控制器设计算法的需求来灵活定制与取用,降低存储压力,加速算法运行,即提高控制器设计效率。

仿真实例

该研究给出了一个典型的数据标准型应用实例。对于给定数据集,为了使得设计出的控制器效果可靠,许多强化学习算法存在近邻搜索的需求。

例如给定回放的样本状态



,算法需要在线计算当前策略



的行为与数据集行为之间的距离:



由于需要遍历数据集中每个样本来寻找最近邻,计算负担非常沉重。

在数据标准型的视角下,对于每个样本,可以通过提前定制一种特殊的空间属性,显著加速近邻搜索这一过程。

具体地,如图3所示,提前在样本空间中约定n个锚点



,对于每个样本,计算其与各锚点的距离保存为空间属性。



图3:标准型的空间属性示意图 图3:标准型的空间属性示意图

当每个样本都具备空间属性后,该研究给出如下空间筛选条件定理来加速近邻搜索。

定理1(空间筛选条件)

考虑一个包含

个锚点的数据集。记C为一个选定的样本,而S为任意其他样本。若S位于C的R-邻域范围内,则一个需要满足的

必要条件为:

其中

表示表示逻辑与运算符。



图4:空间标准型的空间筛选机制示意图

应用这一空间筛选条件,只需要一行判断指令,就可以快速缩小候选范围(如图4所示),显著加速最近邻搜索的过程,从而提高算法的整体运行效率。

该研究在D4RL数据集的Hopper环境下进行了实验,对引入空间标准型前后的训练时间进行了比较。

图5清晰地展示了这一改进:基础版本(蓝色曲线)的训练耗时约20小时,而应用了空间标准型筛选机制(橙色曲线)后,训练时间缩短至仅7小时,实现了三倍的效率提升



图5:应用空间标准型前后的训练时间对比

总的来说,数据标准型可以极小的存储空间开销,换取显著的时间效率优势。

除此之外,它还可以根据算法需求灵活插拔属性部分来降低存储需求,具备扩展性,为提高数据驱动控制算法效率提供了新的方向。

论文链接:https://ieeexplore.ieee.org/document/11107988

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
18点05,CCTV直播!中国男篮vs日本队生死战,郭士强力选人引争议

18点05,CCTV直播!中国男篮vs日本队生死战,郭士强力选人引争议

大秦壁虎白话体育
2026-02-23 22:27:03
墨西哥被击毙的毒枭是谁?他领导的集团疯狂报复,当地已如同“鬼城”

墨西哥被击毙的毒枭是谁?他领导的集团疯狂报复,当地已如同“鬼城”

上游新闻
2026-02-23 18:02:45
张艺谋:第一次见她,我对她说,你等着我们来找你,不要乱演电影

张艺谋:第一次见她,我对她说,你等着我们来找你,不要乱演电影

秀语千寻
2026-02-22 19:28:42
美国被曝已决定对伊朗发动军事打击,预计23日或24日

美国被曝已决定对伊朗发动军事打击,预计23日或24日

每日经济新闻
2026-02-23 14:21:22
别眨眼!上海2550亿大动作启动,影响每一个人

别眨眼!上海2550亿大动作启动,影响每一个人

匹夫来搞笑
2026-02-23 19:33:12
外交部:日方如果真心想发展中日战略互惠关系,就应该撤回高市涉台错误言论

外交部:日方如果真心想发展中日战略互惠关系,就应该撤回高市涉台错误言论

界面新闻
2026-02-23 19:56:21
关于政治最深度最精辟的解释

关于政治最深度最精辟的解释

深度报
2026-02-22 22:47:30
橙子再次被发现!医生发现:高血压患者常吃橙子,或出现4种变化

橙子再次被发现!医生发现:高血压患者常吃橙子,或出现4种变化

小胡军事爱好
2026-02-08 22:34:31
冬奥会各国奖励:中国运动员获赠一台车 美国寒酸 3国一分钱不给

冬奥会各国奖励:中国运动员获赠一台车 美国寒酸 3国一分钱不给

侃球熊弟
2026-02-24 02:15:03
当今社会过得最舒服的几个群体,几乎享受到了所有的时代红利!

当今社会过得最舒服的几个群体,几乎享受到了所有的时代红利!

李老师讲最真教育
2026-02-21 18:58:00
铁饭碗不要了!网传武汉一白富美研究生辞去公职,回家躺平引争议

铁饭碗不要了!网传武汉一白富美研究生辞去公职,回家躺平引争议

火山詩话
2026-02-23 15:36:22
问界通报广东惠州车辆起火事件:非车辆自身原因导致

问界通报广东惠州车辆起火事件:非车辆自身原因导致

界面新闻
2026-02-23 14:05:36
闹大了!相亲没看上,河南一女生把男方照片挂网上,还被本人刷到

闹大了!相亲没看上,河南一女生把男方照片挂网上,还被本人刷到

火山詩话
2026-02-22 14:25:44
前乌军总司令扎卢日内爆出猛料,俄乌开战前夕,泽连斯基多次误判

前乌军总司令扎卢日内爆出猛料,俄乌开战前夕,泽连斯基多次误判

碳基生物关怀组织
2026-02-21 22:57:12
下一届冬奥会开幕时间确定!中日韩争亚洲第一,传来谷爱凌新消息

下一届冬奥会开幕时间确定!中日韩争亚洲第一,传来谷爱凌新消息

侃球熊弟
2026-02-24 00:53:52
单打32强出炉!国乒3人出局;日乒男单折戟一半;韩国女单剩独苗

单打32强出炉!国乒3人出局;日乒男单折戟一半;韩国女单剩独苗

莼侃体育
2026-02-24 00:27:40
不能令人信服的通报,媒体就别转发了吧!

不能令人信服的通报,媒体就别转发了吧!

林中木白
2026-02-23 12:40:41
2026独生子女父母奖励已启动,申领条件与流程全说明

2026独生子女父母奖励已启动,申领条件与流程全说明

趣味萌宠的日常
2026-02-23 22:44:17
不服就干!荷兰打响反华第一枪,通告全球,断的就是中方退路

不服就干!荷兰打响反华第一枪,通告全球,断的就是中方退路

兰妮搞笑分享
2026-02-23 01:50:52
国内假酒产量最大的三个地方?全都是制假高手?千万别再喝了?

国内假酒产量最大的三个地方?全都是制假高手?千万别再喝了?

无意争春
2026-02-23 08:25:54
2026-02-24 05:31:00
量子位 incentive-icons
量子位
追踪人工智能动态
12192文章数 176391关注度
往期回顾 全部

科技要闻

智谱、MiniMax合计蒸发近千亿市值,为何?

头条要闻

墨西哥最大毒枭被击毙:喜欢杀人灭门 几乎没人看见过他

头条要闻

墨西哥最大毒枭被击毙:喜欢杀人灭门 几乎没人看见过他

体育要闻

哈登版骑士首败:雷霆的冠军课

娱乐要闻

那艺娜账号被禁止关注,视频已清空!

财经要闻

美国海关将停止征收被裁定违法的关税

汽车要闻

续航1810km!smart精灵#6 EHD超级电混2026年上市

态度原创

时尚
健康
旅游
房产
军事航空

今年春天一定要拥有的针织,这样穿减龄又好看!

转头就晕的耳石症,能开车上班吗?

旅游要闻

年轻人挤破头!为啥都往北京环球跑?看完懂了

房产要闻

窗前即地标!独占三亚湾C位 自贸港总裁行宫亮相

军事要闻

美军重兵集结蓄力作战之际 新一轮美伊谈判时间“敲定”

无障碍浏览 进入关怀版