网易首页 > 网易号 > 正文 申请入驻

MIT中国博士生提出可验证型神经网络控制器框架,将为控制复杂非线性系统提供全新解决方案

0
分享至

近年来,神经网络控制技术在机器人领域展现出令人惊艳的表现。这项基于深度学习的技术,曾驱动各种先进机器人完成了一系列复杂任务。

对于美国麻省理工学院博士生杨麓洁来说,这些先进机器人的名字,她早已能够脱口而出。


图 | 杨麓洁(来源:杨麓洁)

比如:

有既能泡咖啡、又会主动与人对话的 Figure 通用人形机器人;有会系鞋带、会晾衣服的 ALOHA 操作机器人;还有能越过各种地形执行侦查任务的机器狗等。

所有这些智能机器人的背后,都运行着精心设计的神经网络控制器。

尽管神经网络控制展现出卓越的实用性,但是目前仍然缺乏对于安全关键应用的稳定性保证。

而在控制理论领域,已有学者通过规范优化和形式化方法,为线性控制器或多项式控制器提供了严格的稳定性证明。

然而,要想让更加复杂的神经网络控制器拥有同样的稳定性保证,依然存在一些难题。

对于基于神经网络的控制器来说,开展严格的李雅普诺夫稳定性验证具有重要意义,主要原因如下:

其一,要确保系统的安全性和可靠性。

机器人、自动驾驶汽车、工业控制系统等都会涉及到复杂的动态过程,一旦控制系统失稳可能会导致严重的安全事故。

通过李雅普诺夫稳定性验证,可以形式化地证明系统在一定区域内的渐进稳定性,从而保证系统能够安全可靠地运行。

其二,扩大神经网络在关键领域的应用。

由于缺乏稳定性保证,目前的神经网络控制器在安全关键领域的应用依旧受到很大限制。

而一旦可以对其稳定性进行严格验证,神经网络就能大规模用于机器人、航空航天、生命科学等领域,从而发挥强大的控制性能。

其三,弥补神经网络的理论缺陷。

尽管神经网络在实践中表现卓越,但它本身缺乏坚实的理论基础。

通过与李雅普诺夫稳定性理论相结合,可以为神经网络控制器注入理论支撑,弥补其在可解释性和可靠性方面的不足。

其四,促进控制理论与机器学习的融合。

神经网络和李雅普诺夫理论分别代表着机器学习和控制理论两大领域的最新进展。

针对神经网络控制器进行李雅普诺夫验证,正是将这两个领域进行结合的有力尝试,必将推动两个领域的交叉融合,产生新的理论突破。

其五,应对复杂系统的挑战。

随着控制对象的日益复杂,单一的经典控制方法已经难以完全满足需求。

对于神经网络控制器来说,它具有学习复杂映射的能力。如果其稳定性也能得到保证,将为控制复杂非线性系统提供全新的解决方案。

基于此,杨麓洁和所在团队提出一种新型框架,该框架采用快速经验反证和正则化技术等方法,旨在同时学习神经网络控制器和李雅普诺夫稳定性证明,以便能够适用于复杂的非线性动态系统。


(来源:arXiv)

杨麓洁等人所提出的新公式化方法,不仅定义了现有研究中从未涉及的、更大的可稳定区域,而且改进了针对稳定导数的约束条件,让其只聚焦于可被证明的稳定区域范围。

通过这种新颖的方法,课题组突破了现有神经网络控制器在提供稳定性证明上的瓶颈,为更加复杂的神经网络控制系统提供了更大的可验证稳定区域。

对于李雅普诺夫稳定性条件的验证,该团队采用事后严格验证的方式,利用可扩展的、基于线性边界传播的神经网络验证技术,并运用分支定界算法、以及当前最先进的 α,β-CROWN 神经网络验证器,从而让验证方法兼具高效性和灵活性。

整个训练流程和验证流程,都可以在 GPU(graphics processing unit,图形处理器)上加速完成,无需依赖代价高昂的传统求解器。

通过这种新型验证方式,能够避免使用代价高昂的传统求解器,确保了李雅普诺夫稳定性条件的严格验证。

同时,还能兼顾计算效率和灵活性,让针对神经网络控制器的稳定性验证,变得更加高效和更加可行。

通过此,课题组为复杂非线性系统的稳定控制,提供了新的解决方案,在工业、交通、航空航天等领域都具备潜在应用前景。

其一,可用于机器人控制系统。

即本次方法能用于机器人的运动控制。特别是对于具有复杂非线性动力学的机器人系统来说,利用本次所提出的神经网络控制器和李雅普诺夫证明,能够保证机器人运动的稳定性和收敛性。

其二,可用于自动驾驶和无人机的控制。

自动驾驶汽车和无人机等系统,往往具有非线性和高维度的动力学方程。

而通过本次方法可以设计具有稳定性保证的神经网络控制器,提高自动驾驶和无人机的安全性和可靠性。

其三,可用于航天器和航空器的控制。

航天器和航空器通常具有复杂的非线性动力学模型,而本次方法可以为其提供稳定性保证的神经网络控制解决方案。

其四,可用于工业过程的控制。

许多化工、冶金等工业过程,都涉及到复杂的非线性动态系统。本次方法可用于设计具有稳定性保证的神经网络控制器,优化生产过程的控制性能。

其五,可用于生物医学系统建模与控制。

对于一些生物医学系统比如基因调控网络来说,可以使用非线性动力学模型来描述它。因此,本次方法有望用于这些系统的建模和控制。


(来源:arXiv)

另据悉,在相关论文截稿的前两周,该团队重新审视了论文中的数学公式。

在这次讨论之中,他们不仅针对公式加以深度优化,还发现了领域内已有研究中存在的错误和遗漏。

尽管本次研究的初步实验结果已经远远超越目前该领域的最先进成果。但是,上述发现也让他们决定采取一个大胆的举措:推翻所有已有的实验数据,基于优化后的公式全面设计实验。

“这是一个充满挑战的决定,因为重新进行实验意味着巨大的风险和额外的工作量,但我们坚持确保研究成果的严谨性与准确性。”杨麓洁表示。

经过连续奋战,他们终于在论文截稿前 4 小时,完成了所有实验和论文最后修改,确保了本次成果的高质量和创新性。

最终,相关论文以《用于状态和输出反馈的 Lyapunov 稳定神经控制:一种用于高效合成和验证的新形式》(Lyapunov-stable Neural Control for State and Output Feedback:A Novel Formulation for Efficient Synthesis and Verification)为题发在国际机器学习大会(ICML,International Conference on Machine Learning)[1]。

杨麓洁和丰田研究院戴泓楷博士是共同一作。


图 | 相关论文(来源:arXiv)

下一步,课题组将开展以下几方面探索。

首先,提高模型的普适性与适应性。

即开发基于神经网络的方法,来估计或优化系统的可靠性,以及调试和优化价值函数和控制障碍函数等其他控制指标,从而提高处理复杂动态系统时的可扩展性和灵活性。

其次,将理论与实践加以进一步结合。

目前,课题组已经在无人机、以及一些标准控制基准上取得进展。

未来,可以将本次框架用于更多、更复杂的控制系统,比如用于工业机器人和自动驾驶汽车等,以验证和提高其在复杂实际场景下的稳定性和可靠性。

再次,将开展跨学科的合作。

鉴于所研究问题的复杂性和跨学科特质,他们计划与机器学习领域的专家合作,力争发展更好的解决方案。

如前所述,为了合成通用非线性动态系统的、具有李雅普诺夫稳定性的神经网络控制器的目标,课题组还利用了神经网络验证领域的最新的验证工具 α,β-CROWN(https://abcrown.org)。

α,β-CROWN 由杨麓洁的两位合作者——美国伊利诺伊大学张欢教授、以及美国加州大学博士生施舟行共同研发。

在大规模计算机视觉神经网络稳健性验证和神经网络控制器安全性验证上,α,β-CROWN 展现出出色的扩展能力。

它利用了验证问题的网络结构,通过在神经网络中传播线性边界从而加速运算。

同时,α,β-CROWN 的边界传播过程具有较好的“GPU 友好度”,支持大型网络的高效验证,并能借助分支定界技术来快速评估多个子问题。

因此,杨麓洁也希望能进一步利用 α,β-CROWN 的能力,来解决更多的神经网络控制系统验证问题。


参考资料:

1.https://arxiv.org/pdf/2404.07956

排版:朵克斯

01/ 科学家研发新型微针电极阵列,提出全新MEMS兼容混合制造方案,可用于脑机接口和电化学传感

02/ 科学家设计主动渗透纳米载体,完美平衡药物释放和转胞运作用,助力研发抗肿瘤纳米新药

03/ 科学家制备新型液晶弹性体,无需传统发光体就能实现内源发光,极大降低功能集成材料制造成本

04/ 温和条件也能生产人造钻石,科学家发现新型液态合金体系,成功制备多晶钻石薄膜

05/ 科学家打造文生视频大模型,含四个高效变种可更好处理时空维度,将Transformers与扩散模型完美结合


特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
俄智库:俄罗斯应考虑进行一次威慑性的核爆炸 以吓阻西方

俄智库:俄罗斯应考虑进行一次威慑性的核爆炸 以吓阻西方

财联社
2024-05-31 18:56:07
中国移动广东公司原董事长魏明被查

中国移动广东公司原董事长魏明被查

新京报
2024-06-02 08:30:05
他出身黑道,曾是高官的司机和白手套,迎娶小燕子,后花十年洗白

他出身黑道,曾是高官的司机和白手套,迎娶小燕子,后花十年洗白

阿胡
2024-04-29 11:49:43
千万别拎着公文包逛十一点的商场

千万别拎着公文包逛十一点的商场

悠闲葡萄
2024-06-02 09:45:11
嚣张男子高铁霸占座位,拒绝让靠窗女子入座,叫嚣:我可是大律师

嚣张男子高铁霸占座位,拒绝让靠窗女子入座,叫嚣:我可是大律师

亿通电子游戏
2024-06-01 22:57:32
太炸裂了,办公室里震碎三观的八卦,网友:简直刷新了我的三观

太炸裂了,办公室里震碎三观的八卦,网友:简直刷新了我的三观

四象八卦
2024-06-01 14:32:05
28.98万起,问界新M7 Ultra版发布!余承东称华为智驾有信心干翻特斯拉FSD,还首次回应山西车祸事件

28.98万起,问界新M7 Ultra版发布!余承东称华为智驾有信心干翻特斯拉FSD,还首次回应山西车祸事件

每日经济新闻
2024-05-31 22:49:06
刘德华2024巡回演唱会南京站大麦突下架,巡演南京站或可能被取消

刘德华2024巡回演唱会南京站大麦突下架,巡演南京站或可能被取消

小影的娱乐
2024-06-01 18:51:26
孙卓高考在即母亲发文感谢深圳二高2年多保护隐私,孙海洋更厉害

孙卓高考在即母亲发文感谢深圳二高2年多保护隐私,孙海洋更厉害

九方鱼论
2024-06-02 07:46:49
爆料下安徽的坑爹设计院。避免入坑?

爆料下安徽的坑爹设计院。避免入坑?

华庭讲美食
2024-06-02 07:39:38
李尚福被免去国防部长,虎父无犬子,父亲竟和美国交过手

李尚福被免去国防部长,虎父无犬子,父亲竟和美国交过手

磊子讲史
2024-03-25 14:45:46
中国决战意大利,美波硬碰硬,巴西剑指八连胜,世联最新赛程

中国决战意大利,美波硬碰硬,巴西剑指八连胜,世联最新赛程

撒丁岛体育
2024-06-02 01:18:30
皇马欧冠捧杯君临天下,英格兰天才闪耀银河战舰,金球奖会是他吗

皇马欧冠捧杯君临天下,英格兰天才闪耀银河战舰,金球奖会是他吗

姜大叔侃球
2024-06-02 10:27:24
彻底倒向美囯?拒绝中方移民,驱离中方工人,中方大怒:永不合作

彻底倒向美囯?拒绝中方移民,驱离中方工人,中方大怒:永不合作

星辰故事屋
2024-04-27 19:04:44
收手吧,谢天华!收手吧,古惑仔!“港星养老院”,也是该关张了

收手吧,谢天华!收手吧,古惑仔!“港星养老院”,也是该关张了

圈里的甜橙子
2024-06-01 22:51:30
向佐晒全家福过六一!全程抱娃好宠溺,儿子留长发,郭碧婷又瘦了

向佐晒全家福过六一!全程抱娃好宠溺,儿子留长发,郭碧婷又瘦了

圈里的甜橙子
2024-06-02 04:10:24
复制仁爱礁模式,菲律宾巡逻船滞留仙宾礁,解放军发出最后通牒

复制仁爱礁模式,菲律宾巡逻船滞留仙宾礁,解放军发出最后通牒

文雅笔墨
2024-06-01 15:27:12
美国财长耶伦急了,中方持续减持美债,新债不好发了

美国财长耶伦急了,中方持续减持美债,新债不好发了

世事人物解读
2024-06-01 19:47:00
夺冠功臣!卡瓦哈尔赛后和家人开心合照!为皇马首开记录

夺冠功臣!卡瓦哈尔赛后和家人开心合照!为皇马首开记录

直播吧
2024-06-02 10:31:08
抑郁症其实就是个脾病,焦虑症,是被吓出来的病,祸根并不在大脑

抑郁症其实就是个脾病,焦虑症,是被吓出来的病,祸根并不在大脑

漫步风雨中
2024-05-24 12:55:20
2024-06-02 11:04:49
DeepTech深科技
DeepTech深科技
麻省理工科技评论独家合作
13880文章数 511787关注度
往期回顾 全部

科技要闻

成功着陆!嫦娥六号将开始月背“挖宝”

头条要闻

爆火的郭有才曾边烤腰子边唱歌 粉丝多为"小镇中老年"

头条要闻

爆火的郭有才曾边烤腰子边唱歌 粉丝多为"小镇中老年"

体育要闻

我已伤痕累累 却依然感动不了命运之神

娱乐要闻

白玉兰提名:胡歌、范伟争视帝

财经要闻

新造车5月销量: 小鹏乏力 问界暂"缺席"

汽车要闻

吉利银河E5 Flyme Auto智能座舱首发

态度原创

房产
健康
艺术
家居
军事航空

房产要闻

重磅!琼海出台楼市新政:住房出租、挂牌计划出售,都可减套数!

晚餐不吃or吃七分饱,哪种更减肥?

艺术要闻

穿越时空的艺术:《马可·波罗》AI沉浸影片探索人类文明

家居要闻

风雅自来 中式的和谐平衡

军事要闻

匈牙利总理:欧洲已进入对俄开战准备阶段

无障碍浏览 进入关怀版