网易首页 > 网易号 > 正文 申请入驻

微软研究院开发类GPT化学语言模型,成功设计结核杆菌抑制剂

0
分享至

生成性药物设计是一种利用人工智能和机器学习技术来设计新药物的方法。它涉及到使用算法从头开始设计新分子,优化化合物的特性,以及预测化合物的生物活性和毒性等。

该方法有可能识别未被充分探索的化合物类别和现有库中不存在的新化合物,促进创新治疗策略的发展。

然而,生成的分子的实用性往往有限,因为许多设计只关注一组狭窄的药物相关特性,无法提高后续药物发现过程的成功率。

10 月 29 日,发表在 Nature Communications 上的一篇文章显示,来自微软研究院科学智能中心的团队提出了一种名为TamGen(目标感知分子生成)的方法,TamGen 具有类似 GPT 的化学语言模型,旨在生成类似药物的化合物。

他们证明 TamGen 生成的化合物具有更好的分子质量和活力,并通过 TamGen 确定了 14 种对结核病 ClpP 蛋白酶具有显著抑制活性的化合物,其中最有效的化合物表现出半数最大抑制浓度 (IC50 ) 为 1.9 μM。相关文章题为“TamGen: drug design with target-aware molecule generation through a chemical language model”。

生成式预训练 Transformer(GPT)是大型语言模型的骨干,它不仅能生成文本,还能生成图像和语音,以及理解和解决科学问题 。

TamGen 具有三个模块:(1)化合物解码器,一种类似 GPT 的化学语言模型和 TamGen 的核心组件,为化学空间中的化合物生成奠定了基础;(2)蛋白质编码器,一种基于 Transformer 的模型,用于编码目标蛋白质的结合位;(3)用于化合物编码和细化的上下文编码器。

为了对 TamGen 的整体性能进行基准测试,研究人员将其与 5 种方法进行了比较:liGAN、3D-AR 、Pocket2Mol、ResGen 和 TargetDiff 。这些方法专注于在 3D 空间中直接生成化合物,以便将蛋白质结合位点与多种深度学习技术相匹配。

他们在 CrossDocked2020 数据集上评估了这些方法和 TamGen,该数据集是从 PDBbind 精选出来的成熟基准数据集。使用每种方法在 CrossDocked2020 测试集中为每种目标蛋白生成了 100 种化合物。

评估指标包括:与目标蛋白的结合亲和力;药物相似性;合成可及性评分 (SAS);LogP,分子亲脂性的指标。此外,研究人员还量化了每种方法生成具有分子多样性的多样化化合物的能力。

结果发现,每种方法在不同指标上各有优劣,TamGen 整体表现性较好。例如,TamGen 在 6 个指标中的 5 个中排名第一或第二,并表现出最佳的整体性能。这一发现表明 TamGen 能够在生成过程中同时优化化合物的多个方面。

其中,合成可及性是这些指标中影响候选药物实用性的重要因素,特别是对于新型化合物。为了弄清 TamGen 为何能生成具有高结合亲和力和高合成可及性评分的化合物,他们检查了 TamGen 和其他方法生成的得分最高的化合物。

分析表明,TamGen 倾向于生成具有较少稠环的化合物。且其生成的化合物中稠环的数量与 FDA 批准的药物非常接近。

接下来,研究人员使用 TamGen 生成了针对结核病 ClpP 蛋白酶的化合物,结核病是一种由结核分枝杆菌(Mtb) 引起的传染病。除了之前发现的硼替佐米(一种靶向人类 26S 蛋白酶体并表现出对细菌 ClpP 的抑制活性的肽模拟化合物)外,目前尚无记录的先进抗生素 ClpP 抑制剂。ClpP 是酪蛋白水解蛋白酶P,它是细菌蛋白质降解系统中必需的丝氨酸蛋白酶,也是抗生素开发的新兴靶点。

团队采用了由 TamGen 驱动的设计-改进-测试流程来识别潜在的 ClpP 抑制剂。在设计阶段,利用从蛋白质结构获得的 ClpP 结合口袋,TamGen 生成了 2612 种独特的化合物。

然后使用分子对接和 Ligandformer(一种用于表型活性预测的 AI 模型)筛选这些化合物。在此阶段,排除了与硼替佐米相比对接得分较差的化合物和 Ligandformer 预测的无活性化合物。肽模拟物也被排除在外,因为它们的 ADME(吸收、分布、代谢、排泄) 特性不理想,这是硼替佐米的已知缺点。最后,确定了 4 种种子化合物,用于接下来的改进阶段。

在优化改进阶段,使用 TamGen 生成以目标蛋白和种子化合物为条件的化合物。在这里,除了 TamGen 生成的 4 种代表性化合物外,研究人员还从之前的实验中确定了 3 种具有弱抑制活性的化合物(IC50在 100–200 μM 范围内对结核分枝杆菌 ClpP 有效)。以 ClpP 和这 7 种种子化合物为条件,使用 TamGen 生成了 8,635 种独特化合物,并按照与设计阶段相同的程序筛选化合物。最后,从这些生成的化合物中选出 296 种用于测试阶段。

在测试阶段,确定了 159 种类似物,其中有 5 种在 ClpP1P2 肽酶活性测定中表现出显著的抑制作用。后续剂量反应实验表明,这 5 种化合物的 IC50值均低于 20 μM,其中 Analog-005 脱颖而出,IC50为 1.9 μM。

随后,研究人员利用 TamGen 合成了上述筛选出来的化合物中,抑制效果优良的化合物的衍生物。均证实具有抑制效果。

总而言之,通过 TamGen 支持的设计-改进-测试过程,研究人员确定了与 ClpP 蛋白相互作用的方式与硼替佐米不同的化合物,从而揭示了未来发现 ClpP 抑制剂的新机制。这些化合物具有苯磺酰胺和二苯脲基团作为骨架,与肽模拟物硼替佐米完全不同,为提高 ClpP 抑制剂的生物利用度和分子稳定性提供了一种可能的解决方案。

最后,作者也讨论了 TamGen 成功的原因,并将其归因于 3 个主要因素。首先,嵌入在预训练化合物解码器模型中的化学知识能够生成符合化学规则并具有有利于药物开发的特性的高质量化合物;其次,结合顺序和几何信息的有效结合口袋表示支持稳健的化合物生成;最后,基于变分自动编码器 (VAE) 的上下文解码器允许使用文献中报道的或在前几轮中确定的候选分子来细化命中化合物,从而为给定目标生成改进的化合物。

然而,TamGen 并非没有局限性。例如,它不够灵敏,无法区分具有微小差异的靶标,例如点突变或蛋白质异构体,而这对于针对癌症相关蛋白质和其他疾病的药物设计至关重要;此外,作为一种基于结构的药物设计方法,TamGen 的应用需要靶蛋白的结构和潜在的结合口袋信息。

作者也提到,由于 TamGen 主要专注于识别和扩展目标化合物,尚未对所提议化合物的细胞活性和毒性进行广泛测试。为了进一步推进药物发现流程,需要对这些候选化合物进行额外的评估和优化。

1.Wu, K., Xia, Y., Deng, P. et al. TamGen: drug design with target-aware molecule generation through a chemical language model. Nat Commun 15, 9360 (2024). https://doi.org/10.1038/s41467-024-53632-4

免责声明:本文旨在传递生命科学和医疗健康产业最新讯息,不代表平台立场,不构成任何投资意见和建议,以官方/公司公告为准。本文也不是治疗方案推荐,如需获得治疗方案指导,请前往正规医院就诊。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
自恋型人格专家分析梅西的演讲,得到结论:梅西始终纯粹!

自恋型人格专家分析梅西的演讲,得到结论:梅西始终纯粹!

氧气是个地铁
2025-11-19 22:39:03
包河区委书记调整

包河区委书记调整

网易安徽
2025-11-19 20:28:19
十五运会│举重:刘焕华超世界纪录夺冠

十五运会│举重:刘焕华超世界纪录夺冠

人民资讯
2025-11-20 09:44:01
小米100名车主起诉后,法务84页报告称:“雷军的承诺不算数”

小米100名车主起诉后,法务84页报告称:“雷军的承诺不算数”

麦大人
2025-11-18 14:41:33
释永信被批捕:糜烂私生活披露,女方口供流出,私生女系公职人员

释永信被批捕:糜烂私生活披露,女方口供流出,私生女系公职人员

博士观察
2025-11-19 17:46:43
你以为玛哈是个纨绔国王?

你以为玛哈是个纨绔国王?

老吴教育课堂
2025-11-18 15:25:13
乌克兰需要多少架F-16参战才能获得制空权?

乌克兰需要多少架F-16参战才能获得制空权?

高博新视野
2025-11-17 17:55:26
郑丽文提“一国两区”后,岛内讨论“一国两制方案”,国台办回应

郑丽文提“一国两区”后,岛内讨论“一国两制方案”,国台办回应

DS北风
2025-11-19 19:14:02
生活中,很多中年女人,为什么对丈夫没了兴趣?

生活中,很多中年女人,为什么对丈夫没了兴趣?

思絮
2025-11-20 09:38:12
中俄爆发利益之争?黑龙江以西,普京希望中国出个体面的价格

中俄爆发利益之争?黑龙江以西,普京希望中国出个体面的价格

乐天闲聊
2025-11-19 15:01:29
里子面子都丢了,森林北公布体检结果,把汪峰的体面撕个粉碎

里子面子都丢了,森林北公布体检结果,把汪峰的体面撕个粉碎

鋭娱之乐
2025-11-18 12:44:19
继美韩后,又有两国与日本站边,岛链南翼收紧,中国破局有道

继美韩后,又有两国与日本站边,岛链南翼收紧,中国破局有道

不似少年游
2025-11-20 07:21:35
向美国捐8亿被骂叛徒!无锡唐氏21代掌门:我的钱只认文明归属

向美国捐8亿被骂叛徒!无锡唐氏21代掌门:我的钱只认文明归属

李砍柴
2025-07-18 23:42:24
全剧终了?高市已“举白旗”,不会再乱谈台海问题,马英九没说错

全剧终了?高市已“举白旗”,不会再乱谈台海问题,马英九没说错

混沌录
2025-11-20 00:11:03
江苏假科学家后续,央视一锤定音,坐牢还丢铁饭碗,多人牵连其中

江苏假科学家后续,央视一锤定音,坐牢还丢铁饭碗,多人牵连其中

禾寒叙
2025-11-19 13:32:02
全新奔驰S级曝光,外观大变,内换超大屏,搭载3.0T发动机!

全新奔驰S级曝光,外观大变,内换超大屏,搭载3.0T发动机!

侃故事的阿庆
2025-11-19 12:49:36
这名日本网红,急了!

这名日本网红,急了!

环球时报国际
2025-11-18 21:58:26
大批中国人依然执意去日本旅游,被日媒追问后,他们的回答太扎心

大批中国人依然执意去日本旅游,被日媒追问后,他们的回答太扎心

古装影视解说阿凶
2025-11-20 05:57:10
英伟达盘后涨幅扩大至4.8%

英伟达盘后涨幅扩大至4.8%

每日经济新闻
2025-11-20 05:29:04
中国官员双手插兜,怒视日本,这一载入史册的画面,是什么含义?

中国官员双手插兜,怒视日本,这一载入史册的画面,是什么含义?

江平舟
2025-11-19 16:09:46
2025-11-20 10:39:00
生辉
生辉
专注于生命科学
4121文章数 3437关注度
往期回顾 全部

科技要闻

英伟达单季狂揽570亿美元,手握5000亿订单

头条要闻

日媒爆料:高市或于中国重要日子当天参拜靖国神社

头条要闻

日媒爆料:高市或于中国重要日子当天参拜靖国神社

体育要闻

Faker,何以成为Faker

娱乐要闻

胡彦斌易梦玲恋情曝光,相差16岁

财经要闻

英伟达财报,超预期

汽车要闻

一汽丰田发布IT'S TiME 3.0 三款焕新产品同步亮相

态度原创

手机
游戏
艺术
房产
本地

手机要闻

旗舰销量大于非旗舰,华为令国产友商羡慕

《城市:天际线2》1.4.2f1重大更新上线

艺术要闻

看完启功再对比,田蕴章行书你能认全吗?

房产要闻

29.4亿!海南“地王”片区,要卖超级宅地!

本地新闻

第十二届影展携手重庆来福士丨两江交汇,光影共生

无障碍浏览 进入关怀版