网易首页 > 网易号 > 正文 申请入驻

清华首次提出数据驱动控制新形式,算法效率直翻三倍

0
分享至

iDLab团队 投稿
量子位 | 公众号 QbitAI

当大数据席卷各行各业,控制理论也迎来新的拐点:从依赖模型到依赖数据。

但是,在数据驱动控制领域,却缺乏一种标准化的数据表示形式

针对这一问题,清华大学李升波教授课题组(iDLab)首次将现代控制理论中的标准型概念引入数据驱动控制(datatic control)范式,提出了一种基于数据的系统描述新形式。

每个标准形式的样本由必要的转移和可插拔的属性组成,分别用于描述系统变化规律和人为定义特征。



不仅如此,该数据标准型还可根据算法需求定制属性,显著加速控制器设计,为提高数据驱动算法效率提供了新的思路。

目前,该成果已发表于ACC2025。

从模型标准型到数据标准型

人工智能的蓬勃发展,离不开数据这一核心支柱。

近年来,随着人工智能技术的广泛应用,以数据为核心的系统表征方法迅速渗透到控制领域。

控制系统的设计方法正迎来一场从模型驱动向数据驱动的范式变革,即从传统的模型驱动控制(modelic control,即model-driven control)到数据驱动控制(datatic control,即data-driven control)。



图1:两种控制范式对比

模型驱动控制(上方路径)首先利用系统辨识来拟合一个模型,然后用这个模型来合成控制器。

数据驱动控制(下方路径)则直接利用数据来求解控制器。

在模型驱动控制(modelic control)的范式下,模型的标准型是一个有力工具。

例如,现代控制理论的奠基人鲁道夫·卡尔曼(Rudolf E. Kálmán)指出:将状态空间模型表示为可控标准型或可观标准型,无需额外的判断步骤即可直接确保系统的可控性或可观性。

此外,现代群论的奠基人之一卡米耶·若尔当(Camille Jordan)指出:任何状态空间模型都可以转换为约旦标准型,系统矩阵会变为对角方阵,其对角线元素代表系统的特征值。

因此,只需检查所有特征值是否为负,即可轻松验证系统的稳定性。更进一步,不同的特征值对应着系统不同的模态,这使得控制器设计更具针对性。

数据驱动控制(datatic control)范式下的标准型是一个新问题。

近年来,随着机器人、自动驾驶等具身智能系统的蓬勃发展,海量、复杂的交互数据正以前所未有的速度被生成。这不仅为传统控制算法带来了巨大挑战,也引出了一个全新的议题:

在数据驱动控制范式下,如何构建一个有效利用大规模数据的标准描述方式?即是否存在数据驱动版本的标准型?

数据的描述形式直接决定了后续控制器设计算法的运行效率和可扩展性。

以强化学习为例,训练算法通常涉及大量的迭代计算和高维数据处理。

在这一过程中,算法很容易陷入重复计算的泥潭,例如在每一步训练迭代中,都重新计算样本间的范数距离、特征相似度等信息。

这种重复性的计算不仅耗时,而且对计算资源造成了显著的浪费,严重制约了算法在现实世界中的部署和应用。

因此,如何高效、标准地组织和描述数据,以减少冗余计算、加速算法运行,是数据驱动控制范式面临的一项核心挑战。

类比于模型标准型,该研究首次提出,适用于数据驱动控制系统的标准描述形式:每条样本数据包含两个部分(如图2所示):



图2:数据标准型示意图

(1)必要的转移部分

,即<当前状态

,当前动作



,下一状态



(2)可插拔的属性部分,例如奖励信号或其他人工设计特征。

前者蕴含了控制器设计必要的系统的动力学信息,后者可以根据控制器设计算法的需求来灵活定制与取用,降低存储压力,加速算法运行,即提高控制器设计效率。

仿真实例

该研究给出了一个典型的数据标准型应用实例。对于给定数据集,为了使得设计出的控制器效果可靠,许多强化学习算法存在近邻搜索的需求。

例如给定回放的样本状态



,算法需要在线计算当前策略



的行为与数据集行为之间的距离:



由于需要遍历数据集中每个样本来寻找最近邻,计算负担非常沉重。

在数据标准型的视角下,对于每个样本,可以通过提前定制一种特殊的空间属性,显著加速近邻搜索这一过程。

具体地,如图3所示,提前在样本空间中约定n个锚点



,对于每个样本,计算其与各锚点的距离保存为空间属性。



图3:标准型的空间属性示意图 图3:标准型的空间属性示意图

当每个样本都具备空间属性后,该研究给出如下空间筛选条件定理来加速近邻搜索。

定理1(空间筛选条件)

考虑一个包含

个锚点的数据集。记C为一个选定的样本,而S为任意其他样本。若S位于C的R-邻域范围内,则一个需要满足的

必要条件为:

其中

表示表示逻辑与运算符。



图4:空间标准型的空间筛选机制示意图

应用这一空间筛选条件,只需要一行判断指令,就可以快速缩小候选范围(如图4所示),显著加速最近邻搜索的过程,从而提高算法的整体运行效率。

该研究在D4RL数据集的Hopper环境下进行了实验,对引入空间标准型前后的训练时间进行了比较。

图5清晰地展示了这一改进:基础版本(蓝色曲线)的训练耗时约20小时,而应用了空间标准型筛选机制(橙色曲线)后,训练时间缩短至仅7小时,实现了三倍的效率提升



图5:应用空间标准型前后的训练时间对比

总的来说,数据标准型可以极小的存储空间开销,换取显著的时间效率优势。

除此之外,它还可以根据算法需求灵活插拔属性部分来降低存储需求,具备扩展性,为提高数据驱动控制算法效率提供了新的方向。

论文链接:https://ieeexplore.ieee.org/document/11107988

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
身披七枚勋功章,抱着必死的决心!反诈老陈和平台正面硬刚上了

身披七枚勋功章,抱着必死的决心!反诈老陈和平台正面硬刚上了

垛垛糖
2026-01-08 12:46:19
签约1年!33岁内马尔官宣下家,落选巴西队26个月,还想踢世界杯

签约1年!33岁内马尔官宣下家,落选巴西队26个月,还想踢世界杯

球场没跑道
2026-01-07 10:39:12
流落柬埔寨女网红毒品检测呈阳性,视频主页称“靠自己没用的”,家人赴柬,大使馆提醒

流落柬埔寨女网红毒品检测呈阳性,视频主页称“靠自己没用的”,家人赴柬,大使馆提醒

潇湘晨报
2026-01-06 17:20:18
女人抵抗不了的男人,原来是这个,能保持生理性吸引就是情场王者

女人抵抗不了的男人,原来是这个,能保持生理性吸引就是情场王者

娱乐洞察点点
2026-01-08 11:56:29
也门南方过渡委员会领导人祖贝迪“逃往”阿联酋

也门南方过渡委员会领导人祖贝迪“逃往”阿联酋

新华社
2026-01-08 12:40:14
戴安娜车祸急救员:我以为她能活下来,生命最后她说了这么一句话

戴安娜车祸急救员:我以为她能活下来,生命最后她说了这么一句话

丰谭笔录
2025-12-31 12:27:02
杨兰兰最新:不上课、不社交、英语差,喜欢买买买,香奈儿VVIP

杨兰兰最新:不上课、不社交、英语差,喜欢买买买,香奈儿VVIP

麦大人
2025-10-09 16:23:06
司晓迪给男明星拉P条的瓜!

司晓迪给男明星拉P条的瓜!

八卦疯叔
2026-01-08 11:35:39
中国放出可能扣留售台武器的信号,美国回应来了,还是“双簧”

中国放出可能扣留售台武器的信号,美国回应来了,还是“双簧”

安安说
2026-01-06 14:46:44
高市喊话中国后,不到24小时,中方对日下达禁令,全面断供稀土?

高市喊话中国后,不到24小时,中方对日下达禁令,全面断供稀土?

博览历史
2026-01-07 11:31:40
四川卫视上星!31集谍战大剧来袭,侯勇、郭广平、于震领衔

四川卫视上星!31集谍战大剧来袭,侯勇、郭广平、于震领衔

乐枫电影
2026-01-08 12:25:47
胡适晚年嘲讽毛泽东考不上北大,连《蝶恋花》都不通?蒋介石日记里却说了大实话

胡适晚年嘲讽毛泽东考不上北大,连《蝶恋花》都不通?蒋介石日记里却说了大实话

历史回忆室
2026-01-04 22:07:06
今天会更冷!广东多地结冰,最低-4℃

今天会更冷!广东多地结冰,最低-4℃

鲁中晨报
2026-01-08 09:17:03
美国又干了件石破天惊的事

美国又干了件石破天惊的事

牛弹琴
2026-01-08 07:39:49
48岁保洁阿姨睡在公司1个月,老板打开了监控,第2天送给她20万

48岁保洁阿姨睡在公司1个月,老板打开了监控,第2天送给她20万

秀秀情感课堂
2025-12-12 14:20:05
冲突升级!美抓捕影子油轮与俄核潜艇大西洋对峙,强行登船扣船

冲突升级!美抓捕影子油轮与俄核潜艇大西洋对峙,强行登船扣船

史政先锋
2026-01-08 12:50:30
背心和高腰牛仔裤的配置太美了,有女性的明媚热情!

背心和高腰牛仔裤的配置太美了,有女性的明媚热情!

灼灼小齐
2026-01-08 11:13:06
美国:将“无限期”控制委内瑞拉石油销售

美国:将“无限期”控制委内瑞拉石油销售

新京报政事儿
2026-01-08 07:22:20
王腾自立门户!新公司专戳华为小米“痛点”,这赛道太懂打工人了……

王腾自立门户!新公司专戳华为小米“痛点”,这赛道太懂打工人了……

泡泡网
2026-01-08 11:25:15
WTT多哈冠军赛赛程表!1月8日国乒对阵时间表,CCTV5节目单!

WTT多哈冠军赛赛程表!1月8日国乒对阵时间表,CCTV5节目单!

郝小小看体育
2026-01-08 05:09:41
2026-01-08 13:48:49
量子位 incentive-icons
量子位
追踪人工智能动态
11985文章数 176357关注度
往期回顾 全部

科技要闻

雷军:现在听到营销这两个字都有点恶心

头条要闻

委内瑞拉外长:感谢中方支持

头条要闻

委内瑞拉外长:感谢中方支持

体育要闻

约基奇倒下后,一位故人邪魅一笑

娱乐要闻

2026春节档将有六部电影强势上映

财经要闻

微软CTO韦青:未来人类会花钱"戒手机"

汽车要闻

不谈颠覆与奇迹,智驾企业还能聊点什么?

态度原创

本地
旅游
健康
公开课
军事航空

本地新闻

“闽东利剑·惠民安商”高效执行专项行动

旅游要闻

报告:预计2025-2026冬季,我国冰雪旅游休闲收入有望达到4500亿元

这些新疗法,让化疗不再那么痛苦

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

特朗普提出将美国军费提升至1.5万亿美元

无障碍浏览 进入关怀版