网易首页 > 网易号 > 正文 申请入驻

统一虚拟筛选和活性优化,IDEA研究院提出亲和力基础模型LigUnity

0
分享至



作者 | 论文团队

编辑 | ScienceAI

2025 年 10 月,一篇题为《Hierarchical affinity landscape navigation through learning a shared pocket-ligand space》的论文,作为封面文章发表于 Cell 旗下期刊《Patterns》。该研究由粤港澳大湾区数字经济研究院(IDEA)AI4Science 团队、晶泰科技(XtalPi)及华盛顿大学的研究团队联合攻关,成功开发了名为 LigUnity 的亲和力基础模型。



论文地址:https://www.cell.com/patterns/fulltext/S2666-3899(25)00219-3?_returnURL=https%3A%2F%2Flinkinghub.elsevier.com%2Fretrieve%2Fpii%2FS2666389925002193%3Fshowall%3Dtrue

项目地址:https://idea-xl.github.io/LigUnity

开源代码:https://github.com/IDEA-XL/LigUnity

此项工作不仅是对传统虚拟筛选工具的优化,更是一次范式级的革新 —— 它通过构建蛋白质与配体的共享表示空间,让 AI 统一学习并驾驭从大规模筛选到精细活性优化的完整药物发现流程。

任务背景与挑战

在人体中,上万种蛋白质维持着复杂的生命活动,其中许多蛋白质的异常与疾病直接相关,是潜在的药物靶点。然而,目前仅有约 10% 的蛋白质能被已知的药物分子高效结合,绝大多数靶点仍处于「黑暗」 之中,等待着被有效的药物「点亮」。

为这些靶点找到合适的药物分子,通常分为两个关键步骤:

1. 虚拟筛选 (Virtual Screening):利用计算方法,从包含数亿甚至数十亿分子的巨大化合物库中,快速筛选出少数可能与目标蛋白质结合的「苗头化合物」。此阶段的核心诉求是速度。

2. 苗头化合物优化 (Hit-to-Lead Optimization):在找到苗头化合物后,需要对其化学结构进行精细的修改和优化以增强其活性(活性优化),最终得到可进入后续试验的「先导化合物」。此阶段的核心诉求是精度。

传统方法往往将这两个任务割裂开来,使用不同的工具和模型。这种分离导致了模型效果限制:专注于筛选的模型可能无法精确区分结构相似但活性差异巨大的分子;而专注于优化的模型则难以泛化到具有全新化学骨架的潜力分子。

模型方法与核心创新

LigUnity 的核心创新在于构建了一个统一的亲和力基础模型,让 AI 学会一种能同时理解蛋白质结合口袋和药物分子的「共同语言」。

为实现这一目标,研究团队首先构建了迄今为止规模最大的、以实验(Assay)组织的亲和力数据库 PocketAffDB,其中包含了蛋白质口袋结构信息和近百万活性数据。基于此,LigUnity 通过一种创新的「层级式学习」策略进行训练:

1. 化学骨架判别:首先,模型利于对比学习(Contrastive learning)进行粗粒度的区分。它学习识别活性分子和非活性分子的骨架差异,为虚拟筛选任务打下基础。

2. 药效团排序:然后,模型利于列表排序(Listwise ranking)进行细粒度的优化。它学习对一群结构相似的活性分子,根据其活性的高低进行精确排序,以胜任苗头化合物优化任务。

在预训练期间,LigUnity 同时优化上述目标;在推理时,LigUnity 将蛋白和口袋映射至同一空间,使用余弦相似度计算其活性。在保证了高精度的同时,LigUnity 的速度比传统的分子对接方法(如 Glide-SP)快了百万倍。



实验结果

LigUnity 在横跨 6 大类应用场景的 8 个基准测试中,展现了其卓越的性能。

1. 虚拟筛选任务

  • 全面领先:在 DUD-E、DEKOIS 2.0 和 LIT-PCBA 这三个主流虚拟筛选基准测试中,LigUnity 的表现超越了全部 24 种竞争方法,包括传统的分子对接软件和各类机器学习模型。
  • 性能巨大提升:与表现最好的基线模型相比,LigUnity 在关键指标「富集因子 (EF 1%)」上取得了超过 50% 的性能提升(p < 10⁻⁹)。
  • 强大的泛化能力:即便在排除了与训练集中蛋白质相似(序列相似性 < 30%)的新靶点上进行测试,LigUnity 的性能依然显著优于 Glide SP,表现出对未知靶点的强大预测能力和实用价值。



2. 苗头化合物优化任务

  • 零样本性能优越:在 JACS 和 Merck 这两个行业公认的 FEP 基准测试中,在不使用任何目标数据(zero-shot)的情况下,LigUnity 的预测性能已优于 Glide-SP、MM/GBSA 等传统计算方法及其他机器学习模型,展现了其强大的预训练知识。
  • 少量数据即可媲美「金标准」:当使用少量(10-20 个)已知数据进行微调后,LigUnity 的预测精度(在 Merck 基准上 r² = 0.472)已接近计算成本极度高昂的物理计算「金标准」方法 FEP+(r² = 0.528),为昂贵的实验和计算提供了高性价比的替代方案。
  • 良好的可解释性:尽管未使用蛋白 - 分子结合构象作为输入,LigUnity 仍成功识别出了对结合起关键作用的配体原子和口袋残基,与已知的晶体结构相互作用模式高度吻合,为化学家优化分子提供了可靠指导。



3. 多场景应用的通用性

  • 前瞻研究与骨架跃迁:在模拟真实药物发现的测试中,LigUnity 表现出众。在时间分割(用历史数据预测未来新分子)和化学骨架分割(泛化至训练集中未见的全新化学骨架)设定下,它均超越了所有基线模型,证明其具备突破现有化学空间、发现新潜力分子的强大泛化能力。
  • 对多源、异构数据的鲁棒性:真实世界的生物活性数据来源多样、测量单位不一(如 nM vs. % 抑制率)。得益于其独特的「列表排序」机制,LigUnity 天然的对测量单位不敏感。在 OOD 测试中,其性能相比传统回归模型提升高达 40.2%,展现了其作为基础模型处理复杂、真实世界数据的卓越适应性。



  • 主动学习应用:在模拟真实研发流程的主动学习框架中,研究团队对 TYK2 靶点进行研究,从 10,000 个后续分子中找到活性最好的分子。集成 LigUnity 的框架仅通过 4 轮迭代(400 活性标注数据),就成功找到了活性最高的 3 个分子,证明其能以极少的实验成本,高效地指导药物发现进程。



结论与展望

LigUnity 通过一个统一的、层级式的学习框架,成功地将虚拟筛选与活性优化相结合,在速度、精度和泛化性上均取得了突破。它不仅是一个强大的预测工具,更是一个具备广泛适用性的基础模型,为加速早期药物发现的全流程奠定了坚实的基础。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
自作孽不可活,欧洲反华先锋立陶宛,正渐渐自我淘汰从地图上消失

自作孽不可活,欧洲反华先锋立陶宛,正渐渐自我淘汰从地图上消失

快看张同学
2026-01-17 11:52:54
中方反制开始!2号公告将断日本光刻胶后路,日媒慌了:我们愿意卖

中方反制开始!2号公告将断日本光刻胶后路,日媒慌了:我们愿意卖

白梦日记
2026-01-17 19:08:33
多地“刨猪宴”临时取消!年味狂欢要热情更要理性

多地“刨猪宴”临时取消!年味狂欢要热情更要理性

极目新闻
2026-01-17 11:17:02
-14℃!大到暴雪!江苏下雪情况有变

-14℃!大到暴雪!江苏下雪情况有变

最江阴
2026-01-18 00:06:28
乌克兰精准打击!俄罗斯“影子舰队”全军覆没!

乌克兰精准打击!俄罗斯“影子舰队”全军覆没!

世界探索者探索
2026-01-17 22:55:49
别再可怜李咏了!离世7年后医生揭秘离世真相,难怪选择葬身美国

别再可怜李咏了!离世7年后医生揭秘离世真相,难怪选择葬身美国

LULU生活家
2025-12-29 18:30:47
12胜2负,从西部倒数冲到联盟第一!被质疑刷子,却创造了NBA神迹

12胜2负,从西部倒数冲到联盟第一!被质疑刷子,却创造了NBA神迹

老侃侃球
2026-01-18 03:30:03
陕西一女子,嘴角长了小水泡后脑死亡!医生:这不是上火

陕西一女子,嘴角长了小水泡后脑死亡!医生:这不是上火

39健康网
2026-01-17 19:50:44
首次连败,广东爆冷输球,赛后4个坏消息,徐杰还是申请交易吧

首次连败,广东爆冷输球,赛后4个坏消息,徐杰还是申请交易吧

邹维体育
2026-01-17 21:51:14
老祖宗的智慧:如果第二脚趾长过大拇趾,这种人晚年命运早已注定

老祖宗的智慧:如果第二脚趾长过大拇趾,这种人晚年命运早已注定

卡西莫多的故事
2026-01-17 08:05:09
股民站稳扶好!不出意外的话,1月19日,明天周一将迎核弹级别行情?

股民站稳扶好!不出意外的话,1月19日,明天周一将迎核弹级别行情?

股市皆大事
2026-01-18 10:32:55
多款儿童面霜被曝检出激素、兽药成分

多款儿童面霜被曝检出激素、兽药成分

新快报新闻
2026-01-17 15:27:05
聂卫平葬礼曝光:大儿子手捧遗照,子女悉数到场,现场堆满花圈!

聂卫平葬礼曝光:大儿子手捧遗照,子女悉数到场,现场堆满花圈!

荒野老五
2026-01-18 10:10:56
“北京嫣然儿童医院欠租”引关注,网友捐款达1400万,房东最新回应

“北京嫣然儿童医院欠租”引关注,网友捐款达1400万,房东最新回应

大风新闻
2026-01-17 21:21:16
爷爷是中国表演艺术家,老公是北电书记,她用演技狠狠打了众人脸

爷爷是中国表演艺术家,老公是北电书记,她用演技狠狠打了众人脸

李遝手工制作
2026-01-15 21:08:17
宗馥莉除名娃哈哈大反转,一切都结束了!

宗馥莉除名娃哈哈大反转,一切都结束了!

财经三分钟pro
2026-01-15 16:52:43
梁朝伟穿新款绿大衣推介白酒,本人热情说吉祥话,因“太不社恐”被网友怀疑是AI,品牌工作人员:是真梁朝伟

梁朝伟穿新款绿大衣推介白酒,本人热情说吉祥话,因“太不社恐”被网友怀疑是AI,品牌工作人员:是真梁朝伟

山西晚报
2026-01-17 10:58:20
国米超级进球!10人参与17次传递 关键一刻尽显两大惊喜先生价值

国米超级进球!10人参与17次传递 关键一刻尽显两大惊喜先生价值

国际足球冷雪
2026-01-18 01:46:13
三星长公主没想到,自己下嫁保安丢的面子,竟被18岁儿子找了回来

三星长公主没想到,自己下嫁保安丢的面子,竟被18岁儿子找了回来

削桐作琴
2026-01-08 21:22:07
贵州跑圈“女神”李绍艳离世,年仅30岁,经常在马路上逆行摆拍

贵州跑圈“女神”李绍艳离世,年仅30岁,经常在马路上逆行摆拍

叶公子
2026-01-15 17:20:45
2026-01-18 11:19:00
ScienceAI incentive-icons
ScienceAI
关注人工智能与其他前沿技术
1210文章数 223关注度
往期回顾 全部

科技要闻

AI大事!马斯克:索赔9300亿元

头条要闻

牛弹琴:美欧直接开干 全世界看得目瞪口呆

头条要闻

牛弹琴:美欧直接开干 全世界看得目瞪口呆

体育要闻

越南媒体:李昊将成为越南U23面临的巨大挑战

娱乐要闻

马年春晚首次联排场外细节!

财经要闻

BBA,势败如山倒

汽车要闻

林肯贾鸣镝:稳中求进,将精细化运营进行到底

态度原创

本地
教育
家居
数码
军事航空

本地新闻

云游内蒙|黄沙与碧波撞色,乌海天生会“混搭”

教育要闻

马年寒假来袭!多学科创意作业这样布置——

家居要闻

岁月柔情 现代品质轻奢

数码要闻

绿联海外推MagFlow二合一Magsafe充电宝,25W无线、100W有线快充

军事要闻

伊拉克国防部:已全面接管阿萨德空军基地

无障碍浏览 进入关怀版