![]()
导语
从有限数据中推导最优解是科学发现的终极目标,人工智能为加速这一过程提供了有效途径。现有方法受数据集规模、目标函数假设及传统机器学习技术所限,仅适用于低维或数据充足的问题。本文提出一款优化框架,可高效解决有限数据下的复杂高维优化问题:该方法利用深度神经网络作为代理模型,迭代地搜索最优解,并引入多种机制以避免陷入局部最优,从而显著降低所需样本量。实验结果表明,该方法可在高达 2000 维的问题中稳定找到优于现有方法的解,而传统方法通常受限于约 100 维且需要更多数据。该框架在多种真实系统中均表现出色,性能超越现有算法,不仅推动了高效的知识发现,也为构建新一代自驱动实验室提供了方法基础。
关键词:DANTE、深度主动优化(Deep active optimization)、高维优化(High-dimensional optimization)、黑箱优化(Black-box optimization)、主动学习(Active learning)、深度神经网络(Deep neural networks)
郑鸿盛丨作者
赵思怡丨审校
![]()
论文题目:Deep active optimization for complex systems 论文链接:https://www.nature.com/articles/s43588-025-00858-x 发表时间:2025年8月25日 论文来源:nature computational science
为什么高维、有限数据的优化问题如此困难?
从有限数据中推导最优解,是科学发现与工程设计中的核心目标。在材料科学、生命科学和复杂工程系统中,研究者往往需要在极高维参数空间中寻找最优方案,而每一次性能评估都依赖昂贵实验或高精度仿真。人工智能因此被寄予厚望,期望通过更智能的试验选择策略显著降低试错成本,加速科学发现进程。
然而,现有优化方法在高维、数据稀缺场景下普遍受限。多数经典算法依赖大规模数据或对目标函数作出较强的连续性与平滑性假设,在真实复杂系统中难以成立。贝叶斯优化(Bayesian Optimization, BO)虽适用于黑箱问题,但其有效性通常局限于低维空间;基于蒙特卡洛树搜索(MCTS)或强化学习(Reinforcement Learning, RL)的方法则依赖累积奖励结构和大量交互数据,难以处理非累积目标和高成本评估问题。与此同时,传统代理模型在高维非线性条件下要么依赖强先验、要么易发生过拟合,进一步制约了优化性能。
一种面向有限数据的高维优化新框架:
DANTE
针对有限数据、非累积目标条件下的高维复杂优化问题,研究提出了“深度主动优化结合神经代理引导树探索(DANTE)”算法。该方法并非试图精确重建目标函数,而是以“如何更高效地分配有限试错资源”为核心出发点,构建了一套数据驱动的闭环优化框架。
整体流程以深度神经网络(Deep Neural Network, DNN)作为代理模型,学习输入参数与目标性能之间的复杂映射关系;在此基础上,通过神经代理引导树探索(Neural-surrogate-guided Tree Exploration, NTE)策略,对高维搜索空间进行结构化探索;利用数据驱动的上置信界(Data-driven Upper Confidence Bound, DUCB)机制平衡探索与利用;最终将筛选出的高价值候选样本送入真实验证源(如实验、第一性原理计算或高精度仿真)进行评估,并将新获得的标注数据反馈至数据库,更新代理模型,形成持续迭代的优化循环。
![]()
图1 整体框架示意,该图展示了DANTE的闭环优化流程:数据库中的初始样本用于训练深度代理模型;代理模型引导树搜索模块在参数空间中生成候选解;真实验证源对候选解进行评估;新数据回流至数据库并更新模型。该流程强调“模型—搜索—验证”的协同演化,是典型的主动优化(Active Optimization)框架。
值得注意的是,DANTE在方法设计上突破了现有优化算法的维度限制。实验结果表明,该算法能够稳定处理高达 2000 维的优化问题,而多数主流方法的有效维度通常受限于 100 维左右。同时,DANTE在样本利用效率上具有显著优势,能够在有限数据条件下持续逼近甚至达到全局最优解。
DANTE 如何在高维空间中避免“走错路”?
DANTE的方法创新集中体现在神经代理引导树探索(NTE)模块及其配套机制上,这些设计均针对高维、有限数据场景下的核心难题进行优化。首先,算法引入条件选择机制与局部反向传播机制,以解决传统树搜索中常见的“价值衰减问题”和局部最优陷阱。条件选择通过比较根节点与子节点的潜在价值,避免搜索过程在低价值区域盲目扩展;局部反向传播则仅在有限范围内更新访问信息,减弱早期错误判断对后续搜索路径的长期约束。
其次,研究将传统上置信界(UCB)推广为数据驱动的 DUCB,将深度神经网络的节点价值预测直接纳入置信界计算中。这一改进有效避免了高维场景下 UCB 因访问次数为零而产生的无穷值问题,同时显著降低了对大量随机模拟的依赖,从而减少计算成本。进一步地,算法引入自适应探索机制,在发现高价值数据点时主动增强探索强度,实现探索与利用之间的动态平衡。
此外,DANTE还提出了顶级访问采样策略,在候选样本选择阶段综合考虑模型预测性能与节点访问频率,从而提升代理模型在后续迭代中的泛化能力。在代理模型选择上,深度神经网络被证明是DANTE成功的关键因素之一。相比高斯过程、决策树等传统模型,DNN 更擅长拟合高维非线性分布,能够捕捉复杂系统中的隐含结构关系。
![]()
图2 神经代理引导树探索(NTE)机制示意。深度神经网络为搜索节点提供潜在价值评估,数据驱动的上置信界(DUCB)据此调控搜索方向。通过条件选择与局部反向传播机制的协同作用,算法能够避免在高维空间中陷入局部最优,并逐步向全局最优解推进。
从方法论角度看,DANTE与 BO、MCTS、RL 形成了明确区分:其无需训练策略网络,不依赖累积奖励结构,且在高维、大初始数据集条件下表现出更优的收敛特性。
从数学基准到真实系统:
DANTE 的效果如何?
为系统评估DANTE的性能,研究从合成函数基准测试和真实世界任务两个层面展开了大规模实验,对比对象涵盖 11 类主流的启发式、贝叶斯及树基优化算法。在合成测试中,研究选取了 20 至 2000 维范围内的 6 类经典非线性非凸函数(包括 Ackley、Rastrigin、Rosenbrock 等)作为验证基准。结果显示,DANTE在 80%–100% 的测试案例中,以极少样本成功达到全局最优,而多数对比算法在样本受限条件下无法收敛至全局最优。
在无噪声、数据易获取的真实任务中,DANTE被应用于神经网络架构搜索、复杂合金性能优化、月球着陆最优控制以及透射电子显微镜(TEM)图像分辨率优化等跨学科问题。实验结果表明,DANTE在关键性能指标上普遍优于现有方法 10%–20%,在部分场景中(如 TEM 参数优化)甚至超越了人类专家的经验选择。在与强化学习算法(如 PPO)的对比中,DANTE在初始阶段表现出明显优势,体现了其对有限数据场景的适配能力。
图3 基准测试与真实任务结果,该图系统展示了DANTE在高维合成函数和真实科学任务中的收敛行为。相比其他方法,DANTE在更少样本下更快逼近最优解,验证了其在数据效率与高维适应性方面的优势。
在高成本、高维、带噪声的复杂真实任务中,如结构材料设计、环肽结合体设计以及高维合金输运性能优化,DANTE在样本数量更少的前提下,实现了 9%–33% 的性能提升,进一步证明了其方法的通用性与稳健性。
从算法到范式:高维优化的新可能
通过系统的理论设计与多维度实验验证,研究表明,深度学习与树搜索机制的有机结合能够有效应对有限数据、高维非线性优化问题。DANTE的核心优势在于其对高维场景的高度适配性,以及在样本受限条件下稳定收敛的能力,使其成为解决复杂系统优化问题的一种高效工具。
研究同时指出,当前DANTE的性能瓶颈主要受限于代理模型的表达能力和计算机内存资源,而非算法框架本身。未来,随着更先进代理模型的引入以及计算资源的提升,DANTE有望进一步突破 2000 维以上的优化限制。在应用层面,该方法不仅适用于材料科学、物理和计算机科学等基础研究领域,也可扩展至金融优化等多种量化场景。尤其是在与机器人系统和自动化实验平台相结合后,DANTE有潜力推动自主化实验室的发展,加速材料发现与药物研发等科学过程的智能化进程,成为跨学科高维非线性优化的重要通用方法。
计算神经科学第三季读书会
从单个神经元的放电到全脑范围的意识涌现,理解智能的本质与演化始终是一个关于尺度的问题。更值得深思的是,无论是微观的突触可塑性、介观的皮层模块自组织,还是宏观的全局信息广播,不同尺度的动力学过程都在共同塑造着认知与意识。这说明,对心智的研究从最初就必须直面一个核心挑战:局部的神经活动如何整合为统一的体验?局域的网络连接又如何支撑灵活的智能行为?
继「」与「」读书会后,集智俱乐部联合来自数学、物理学、生物学、神经科学和计算机的一线研究者共同发起,跨越微观、介观与宏观的视角,探索意识与智能的跨尺度计算、演化与涌现。重点探讨物理规律与人工智能如何帮助我们认识神经动力学,以及神经活动跨尺度的计算与演化如何构建微观与宏观、结构与功能之间的桥梁。
详情请见:
1.
2.
3.
4.
5.
6.
7.
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.