ITMO大学震撼推出AI药物设计"管弦乐团"|化学|实验|靶点

分享至

这项由俄罗斯圣彼得堡ITMO大学的Gleb V. Solovev领衔的国际研究团队发表于2025年11月的人工智能领域重要学术成果，论文编号为arXiv:2511.08217v1，为药物发现领域带来了一场真正的革命。研究团队汇集了来自ITMO大学、Sber AI Lab、D ONE AG和HSE大学的顶尖科学家，他们共同开发了一个名为MADD（Multi-Agent Drug Discovery Orchestra，多智能体药物发现管弦乐团）的创新系统。

在传统药物研发中，寻找有效的候选药物分子就像在茫茫大海中捞针一样困难。科学家们需要筛选数百万个化合物，耗费巨大的人力物力，成功率却极低。更令人头疼的是，即使有了强大的人工智能工具，这些工具往往过于复杂，实验室的研究人员很难直接使用。就像拥有一台超级跑车，但没有驾照的人根本开不了一样。

MADD系统的出现彻底改变了这种状况。它就像一支训练有素的管弦乐团，由四个不同职能的AI特工组成，每个特工都有自己的专长。当用户用普通话提出需求，比如"我需要找到能治疗阿尔茨海默病的新药"，这个系统就会像指挥家一样协调各个特工，自动完成从理解需求、设计分子到预测性质的整个流程。

研究团队在七个具体的疾病案例上验证了MADD系统的效果，包括阿尔茨海默病、帕金森病、多发性硬化症、肺癌、血脂异常、药物抗性以及血小板减少症。结果显示，MADD在复杂任务上的准确率达到了79.8%，大幅超越了现有的其他AI药物设计系统。更重要的是，研究团队首次将AI主导的药物设计应用到了STAT3、ABL、COMT、ACL和PCSK9等五个生物靶点，成功识别出了多个具有良好生物活性和结合亲和力的候选药物分子。

这项研究不仅提供了一个实用的药物发现工具，还为学术界贡献了一个全新的基准数据集。这个数据集包含了超过300个用户查询和超过300万个分子的对接评分数据，为未来的智能药物设计研究提供了宝贵资源。

一、四个特工的完美协作：MADD系统的核心架构

MADD系统的设计理念源于现实世界中成功的团队合作模式。就像一家高效的广告公司，不同部门各司其职却又密切配合，MADD由四个专门的AI特工组成，每个都有明确的职责分工。

首先登场的是分解器特工（Decomposer），它的作用就像一个善于倾听的客服代表。当用户提出复杂的药物发现需求时，分解器会仔细分析这个需求，并将其拆解成若干个可以具体执行的小任务。比如，当用户说"我需要一种既能穿透血脑屏障又对GSK-3β蛋白有高活性的阿尔茨海默病治疗药物"时，分解器会将此分解为"生成GSK-3β抑制剂"和"确保药物具有良好的血脑屏障通透性"两个独立任务。

接下来，协调器特工（Orchestrator）就像一位经验丰富的项目经理，它会制定详细的执行计划，决定调用哪些工具来完成每个任务。协调器拥有丰富的工具库，包括分子生成算法、性质预测模型以及各种数据处理工具。它会根据任务需求，智能地选择最合适的工具组合。

在分子生成和性质分析完成后，总结器特工（Summarizer）发挥作用，它就像一位专业的报告撰写员，将所有结果整理成清晰易懂的格式呈现给用户。总结器不仅会提供生成的分子结构，还会详细说明每个分子的各项性质指标，帮助用户做出明智的选择。

最后，聊天助手特工（Chat Agent）扮演着人机交互的桥梁角色，它帮助用户完善查询表述，提供系统功能咨询，确保整个交互过程顺畅自然。当用户的需求不够明确时，聊天助手会主动询问澄清，就像一位贴心的助理。

这种多特工架构的最大优势在于专业化分工。每个特工只需专注于自己最擅长的领域，大大减少了错误累积的可能性。同时，这种模块化设计也提供了极大的灵活性，可以根据不同的药物发现场景灵活调整工作流程。

二、强大的工具库：让AI药物设计如虎添翼

MADD系统的核心竞争力来自于其丰富而精密的工具库，这些工具就像厨师手中的各种精良厨具，每一种都有其特定的用途和优势。

在分子生成方面，MADD配备了两种不同类型的生成模型。第一种是基于LSTM的生成对抗网络（GAN），它就像一位快速反应的素描画家，能够在短时间内产生大量分子结构草图。这种方法速度极快，生成1万个分子仅需1.88秒，非常适合需要快速探索化学空间的场景。第二种是基于Transformer的条件变分自编码器（CVAE），它更像一位精工细作的艺术家，虽然工作速度较慢（生成1万个分子需要45分钟），但能够生成质量更高、更符合特定性质要求的分子。

这两种生成模型都在包含约50万个ChEMBL分子的数据集上进行了预训练，涵盖了多种疾病相关的化学结构。研究团队特别注重分子的多样性和新颖性，确保生成的化合物不仅满足性质要求，还具有足够的结构创新性。

在性质预测方面，MADD集成了多种机器学习模型来预测分子的关键药物性质。其中最重要的是IC50预测，这个指标就像药物的"杀伤力指数"，表示抑制生物过程50%所需的药物浓度。系统还能预测分子的合成可及性（SA Score），这就像评估一道菜的制作难度，分数越低说明分子越容易在实验室中合成。

此外，系统还整合了药物相似性评估（QED）功能，这就像给分子打一个"像药物程度"的分数。系统还包含多种安全性过滤器，能够识别并排除可能有毒或有害的分子结构，确保生成的候选药物具有基本的安全保障。

特别值得一提的是，MADD还配备了自动化机器学习工具FEDOT，这个工具就像一位经验丰富的数据科学家，能够根据用户提供的新数据自动训练定制化的预测模型。这意味着当面对全新的疾病靶点时，系统可以快速学习并适应，而不需要人工干预。

三、性能验证：在真实药物发现任务中展现卓越表现

为了验证MADD系统的实际效果，研究团队设计了一系列全面的测试，就像对一款新车进行各种路况的试驾一样。他们不仅要验证系统的技术性能，更要确保它在真实的药物发现场景中能够发挥实用价值。

研究团队首先构建了一个全新的基准测试数据集，这个数据集就像一本标准化的考试题库，包含了超过300个不同复杂度的用户查询。这些查询被分为三个难度等级：简单查询（Dataset S）每个只包含一个任务，中等查询（Dataset M）包含1到3个任务，复杂查询（Dataset L）则包含4到5个相关联的任务。

在与现有系统的对比测试中，MADD表现出了压倒性的优势。在最复杂的任务上，MADD达到了79.8%的综合准确率，而目前业界最好的竞争系统ChemAgent仅能达到16.4%的准确率。这种差距就像专业厨师与业余爱好者之间的区别一样明显。

更令人印象深刻的是MADD在分子生成质量方面的表现。在严格的过滤标准下，MADD的Transformer模型能够生成13.4%到18.2%的高质量"命中"分子，这些分子同时满足生物活性、合成可及性、药物相似性等多项严格要求。相比之下，其他基于大语言模型的系统生成的有效分子比例通常不超过2.56%。

研究团队还特别测试了系统的自动化学习能力。当面对血小板减少症这个在系统开发过程中从未见过的新疾病时，MADD能够自动训练新的预测模型，达到R?=0.75的预测精度，与专门为此疾病开发的SYK-FBRL方法（R?=0.78）相当接近。这就像一位优秀的学生能够快速掌握全新的知识领域一样。

系统的效率优势同样显著。MADD生成132个符合所有性质要求的分子，而对比方法需要生成7.6万个分子才能获得139个合格候选物。这意味着MADD的命中效率比传统方法高出近600倍，大大节省了计算资源和时间成本。

四、创新突破：AI主导的药物设计新范式

MADD系统最令人兴奋的成就之一是成功将AI主导的药物设计应用到了五个此前未被充分探索的生物靶点。这就像开辟了五条全新的药物发现道路，为治疗相关疾病提供了新的可能性。

在阿尔茨海默病研究中，MADD成功设计了针对GSK-3β蛋白的新型抑制剂。GSK-3β蛋白就像大脑中的一个"过度活跃的工人"，它的异常活动会导致tau蛋白过度磷酸化，最终形成阿尔茨海默病的特征性病理结构。MADD生成的分子不仅能有效抑制这个蛋白，还具有更好的合成可及性和药物相似性，平均QED评分比现有化合物提高了11.8%。

在癌症治疗领域，系统针对KRAS G12C突变设计了新的抑制剂。KRAS蛋白就像细胞中的一个"开关"，当它发生G12C突变时会卡在"开启"状态，导致细胞无法控制地增殖形成肿瘤。MADD设计的抑制剂不仅能特异性结合突变的KRAS蛋白，还避免了与正常的HRAS和NRAS蛋白结合，大大减少了潜在的副作用。

对于多发性硬化症，MADD开发了新型的BTK抑制剂。BTK蛋白是免疫细胞信号传导的关键分子，就像免疫系统的"司令官"。通过抑制BTK，可以调节过度活跃的免疫反应，减少对神经系统的攻击。系统生成的非共价BTK抑制剂具有更好的选择性和血脑屏障透过性。

在心血管疾病防治方面，MADD为血脂异常症设计了新的治疗分子。这些分子能够抑制PCSK9蛋白，这个蛋白就像胆固醇代谢的"调节阀"，适当的抑制可以有效降低血液中的低密度脂蛋白胆固醇水平，减少心血管疾病风险。

最后，在帕金森病研究中，系统开发了新的ABL激酶抑制剂。ABL激酶在神经元中就像一个"压力感受器"，当它过度活跃时会加速神经细胞死亡。MADD设计的抑制剂能够有效调节这个通路，潜在地延缓疾病进展。

五、技术创新：多智能体架构的设计智慧

MADD系统的技术创新不仅体现在最终的应用效果上，更体现在其巧妙的架构设计中。这种多智能体架构就像一个高效的工厂流水线，每个环节都经过精心优化，确保整体效率最大化。

在系统的核心是一个基于Llama-3.1-70b的大语言模型，研究团队通过大量实验确定这是最适合药物发现任务的模型。他们测试了包括GPT-4o、Claude Sonnet、DeepSeek等多个先进模型，发现Llama-3.1-70b在工具选择准确率方面达到了92.3%的优异表现，同时具有良好的成本效益。

系统的工具整合策略也颇具匠心。与简单的工具堆叠不同，MADD采用了分层工具管理策略。基础工具直接由协调器调用，而复杂的自动化学习任务则通过专门的AutoML-DL和DatasetBuilder工具来处理。这种设计就像现代汽车的动力系统，日常驾驶使用普通引擎，需要额外动力时启动涡轮增压。

在数据处理方面，MADD整合了ChEMBL和BindingDB等权威数据库，建立了包含超过300万分子对接评分的大规模数据集。这个数据集就像药物发现领域的"地图"，为AI模型提供了丰富的学习材料。系统还实现了数据的自动更新和质量控制，确保训练数据的可靠性。

分子表示方法的选择也经过了精心考虑。系统支持SMILES字符串、分子指纹和分子描述符等多种表示方法，能够根据具体任务自动选择最合适的表示方式。这就像一个多语言翻译系统，能够在不同的"分子语言"之间自由转换。

六、验证实验：与传统方法的全面对比

为了充分验证MADD系统的优越性，研究团队设计了多层次的对比实验，就像对一款新产品进行全方位的质量检测一样。

在与现有LLM工具的对比中，MADD展现出了压倒性的优势。ChemDFM、LlasMol、X-LoRA-Gemma等系统在面对复杂任务时几乎完全失效，生成有效分子的比例不超过0.5%。这些系统就像只会背书的学生，虽然掌握了大量知识，但缺乏将知识灵活运用到实际问题中的能力。

在分子生成质量的评估中，研究团队使用了五层渐进式过滤标准，从基本的生物活性要求到严格的药物相似性标准。MADD的Transformer模型在最严格的过滤条件下仍能保持13%以上的成功率，而大多数对比方法的成功率不到1%。这种差异就像专业运动员与业余爱好者在比赛中的表现差距。

特别有意义的是与实验验证数据的对比。在阿尔茨海默病案例中，MADD生成的GSK-3β抑制剂与ChEMBL数据库中实验验证的化合物相比，不仅保持了相当的生物活性，还在合成难度和药物相似性方面有显著改进。生成分子的平均合成难度更低，意味着更容易在实验室中制备，而平均QED评分的提升则表明这些分子更像真正的药物。

在新颖性评估中，MADD生成的分子与训练数据的平均相似度为0.43，这表明系统确实在创造新的化学结构，而不是简单地重复已知化合物。这种创新能力对于药物发现至关重要，因为真正突破性的药物往往来自于全新的化学结构。

系统的自动化学习能力在血小板减少症案例中得到了充分验证。面对这个系统开发时未见过的疾病，MADD能够在不到一天的时间内自动构建预测模型并生成有效的候选化合物，展现了良好的泛化能力。

七、实际应用：从实验室到临床的桥梁

MADD系统的设计目标不仅仅是学术研究，更是要为实际的药物发现工作提供实用的工具。就像从概念车到量产车的转变一样，系统在设计时就充分考虑了实际应用的需求。

系统的用户界面设计极其友好，研究人员只需用自然语言描述需求即可。比如，一位研究阿尔茨海默病的科学家可以简单地输入"我需要能够穿透血脑屏障的GSK-3β抑制剂"，系统就会自动理解需求并开始工作。这种交互方式就像与一位经验丰富的同事对话一样自然。

在计算效率方面，MADD针对实际应用场景进行了优化。GAN模型的超高速度使其适合快速筛选和初步探索，而Transformer模型的高质量输出则适合精细化设计。用户可以根据项目需求和时间限制灵活选择。

系统还提供了详细的结果解释功能。对于每个生成的分子，系统不仅提供化学结构，还会详细说明各项性质预测结果，包括对接评分、合成难度、药物相似性等。这些信息以直观的表格和图表形式呈现，帮助研究人员快速做出决策。

为了确保结果的可靠性，MADD集成了多重验证机制。生成的分子会自动通过多个安全性过滤器，排除已知的有毒或有害结构。同时，系统还会计算分子的新颖性指标，帮助用户了解这些分子在现有化学空间中的独特性。

八、局限性与未来发展：诚实面对挑战

尽管MADD系统展现了优异的性能，但研究团队也坦诚地指出了当前系统的局限性，这种科学的态度就像优秀的工程师在产品发布时诚实地说明使用注意事项。

目前系统最大的限制是需要用户提供疾病相关的训练数据。就像厨师需要食材才能做菜一样，MADD需要足够的分子活性数据才能训练出有效的预测模型。对于全新的疾病靶点，用户可能需要花费相当的时间和精力来收集和整理数据。

另一个挑战是生成分子的合成可行性验证。虽然系统能够预测合成难度，但实际的实验室合成可能面临预料之外的技术困难。这就像工程师设计的图纸在实际加工时可能遇到意想不到的问题一样。

系统的可解释性也有待改进。目前的黑盒式工作方式虽然效果良好，但研究人员可能希望了解系统做出特定决策的原因。未来版本计划增加决策日志功能，让整个推理过程更加透明。

在工具扩展方面，当前系统添加新功能需要直接修改代码，这对编程能力有限的用户来说可能是个障碍。研究团队正在开发更加模块化的架构，让用户可以更容易地集成第三方工具。

最重要的是，当前所有结果都基于计算预测，缺乏大规模的实验验证。虽然个别案例与已知实验数据的对比显示了良好的一致性，但要确立系统的真实价值，还需要更多的湿实验室验证工作。

研究团队已经制定了详细的改进计划。他们将与多个制药公司合作，对系统生成的候选化合物进行实际的生物活性测试。同时，团队也在开发更加智能的数据收集工具，帮助用户更容易地获得高质量的训练数据。

对于未来的发展方向，研究团队特别强调了实验验证的重要性。虽然AI系统能够以前所未有的速度和规模探索化学空间，但只有少数候选化合物能够在实验室中得到验证。这种计算预测与实验验证之间的瓶颈是整个领域面临的共同挑战。

不过，这种挑战也意味着巨大的机遇。随着自动化实验技术的发展，未来可能实现AI设计与机器人合成的无缝对接，真正实现从想法到候选药物的全流程自动化。MADD系统为这个愿景提供了重要的技术基础。

说到底，MADD系统代表了药物发现领域的一个重要里程碑。它不仅展示了多智能体架构在复杂科学问题中的巨大潜力，更为整个药物发现行业提供了一个实用的工具。虽然从计算预测到临床应用还有很长的路要走，但这个系统已经为加速新药发现迈出了坚实的一步。

对于普通人来说，这意味着未来可能会有更多有效的新药以更快的速度、更低的成本被发现出来。虽然我们可能无法直接使用这个系统，但它的影响终将通过更好的医疗治疗方案惠及每个人。更重要的是，MADD系统开源的决定意味着全世界的研究人员都可以在这个基础上进一步创新，推动整个人类对抗疾病事业的进步。

有兴趣深入了解技术细节的读者可以通过论文编号arXiv:2511.08217v1查询完整的研究报告，也可以访问研究团队在GitHub上开源的代码和数据集，亲身体验这个革命性的药物发现工具。

Q&A

Q1：MADD系统是什么？

A：MADD是由俄罗斯ITMO大学开发的多智能体药物发现系统，它像一支管弦乐团一样由四个AI特工协作工作，能够根据用户的自然语言需求自动设计和筛选候选药物分子，在复杂任务上的准确率达到79.8%。

Q2：MADD系统比传统药物发现方法有什么优势？

A：MADD系统的命中效率比传统方法高出近600倍，只需生成132个分子就能获得合格候选物，而传统方法需要生成7.6万个分子。同时，它生成的分子在合成难度和药物相似性方面都有显著改进。

Q3：普通人能使用MADD系统吗？

A：目前MADD主要面向专业研究人员，但研究团队已经将代码和数据集完全开源，任何人都可以在GitHub上获取。未来这种AI药物设计技术的普及将加速新药发现，最终让更多有效药物以更低成本惠及普通患者。

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.